Как настроить смартфоны и ПК. Информационный портал
  • Главная
  • Новости
  • Расширенные языки разметки данных SGML, XML. Смотреть что такое "XML" в других словарях Html является приложением sgml стандартного

Расширенные языки разметки данных SGML, XML. Смотреть что такое "XML" в других словарях Html является приложением sgml стандартного

История

Рассмотрим пример простого кулинарного рецепта, размеченного с помощью XML:

> Простой хлеб> > Мука> Дрожжи> Тёплая вода> Соль> > > > Смешать все ингредиенты и тщательно замесить.> > Закрыть тканью и оставить на один час в тёплом помещении.> > Замесить ещё раз, положить на противень и поставить в духовку.> > >

Объявление XML

Первая строка XML-документа называется объявление XML (англ. XML declaration ) - это строка, указывающая версию XML. В версии 1.0 объявление XML может быть опущено, в версии 1.1 оно обязательно. Также здесь может быть указана кодировка символов и наличие внешних зависимостей.

Спецификация требует, чтобы процессоры XML обязательно поддерживали Юникод -кодировки UTF-8 и UTF-16 (UTF-32 не обязателен). Признаются допустимыми, поддерживаются и широко используются (но не обязательны) другие кодировки, основанные на стандарте ISO/IEC 8859 , также допустимы другие кодировки, например, русские Windows-1251 , KOI-8 . Часто в тегах принципиально не используют не-латинские буквы, в этом случае UTF-8 является очень удобной кодировкой - объём, как правило, меньше, чем при UTF-16; декодирование может быть выполнено как для всего документа, так и для конкретных атрибутов и текстов; весь документ не содержит запрещённых символов при попытке разбора с неправильной кодировкой.

Корневой элемент

Важнейшее обязательное синтаксическое требование заключается в том, что документ имеет только один корневой элемент (англ. root element ) (также иногда называемый элемент документа (англ. document element )). Это означает, что текст или другие данные всего документа должны быть расположены между единственным начальным корневым тегом и соответствующим ему конечным тегом.

Следующий простейший пример - правильно построенный документ XML:

Следующий пример не является корректным XML-документом, потому что имеет два корневых элемента :

> Сущность №1> > Сущность №2>

Комментарий

В любом месте дерева может быть размещен элемент-комментарий . XML-комментарии размещаются внутри специального тега, начинающегося с символов . Два знака дефис (--) внутри комментария присутствовать не могут.

Теги внутри комментария обрабатываться не должны.

Теги

Остальная часть этого XML-документа состоит из вложенных элементов , некоторые из которых имеют атрибуты и содержимое . Элемент обычно состоит из открывающего и закрывающего тегов, обрамляющих текст и другие элементы. Открывающий тег состоит из имени элемента в угловых скобках, например, , а закрывающий тег состоит из того же имени в угловых скобках, но перед именем ещё добавляется косая черта, например, . Имена элементов, как и имена атрибутов, не могут содержать пробелы , но могут быть на любом языке, поддерживаемом кодировкой XML-документа. Имя может начинаться с буквы, подчёркивания, двоеточия. Остальными символами имени могут быть те же символы, а также цифры, дефис, точка.

В XML есть несколько предопределённых сущностей, таких как lt (ссылаться на неё можно написав <) для левой угловой скобки и amp (ссылка - &) для амперсанда. Возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков.

Ниже приведён пример использования предопределённой сущности для избежания использования знака амперсанда в названии:

> AT& T>

Полный список предопределённых сущностей состоит из & (&), < (<), > (>), " (") и " (") - последние две полезны для записи разделителей внутри значений атрибутов. Определить свои сущности можно в DTD-документе.

Иногда бывает необходимо определить неразрывный пробел, который очень часто используется в HTML и обозначается как. В XML такой предопределённой сущности нет, его записывают, а использование вызывает ошибку. Отсутствие этой весьма распространённой сущности у множества программистов зачастую вызывает удивление и это создаёт некоторые трудности при миграции своих HTML-разработок в XML.

Ссылка по номеру символа (англ. numeric character reference ) выглядит как ссылка на сущность, но вместо имени сущности указывается символ # и число (в десятичной или шестнадцатеричной записи), являющееся номером символа в кодовой таблице Юникод . Это обычно символы, которые невозможно закодировать напрямую, например, буква арабского алфавита в ASCII -кодированном документе. Амперсанд может быть представлен следующим образом:

> AT& T>

Существуют и другие правила, касающиеся составления корректного XML-документа.

Сильные и слабые стороны

Достоинства

Недостатки

  • Неоднозначность моделирования.
  • XML не содержит встроенной в язык поддержки типов данных . В нём нет строгой типизации, то есть понятий «целых чисел», «строк», «дат», «булевых значений» и т. д.
  • Иерархическая модель данных , предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами и сетевой моделью данных.

Отображение XML во Всемирной паутине

Наиболее распространены три способа преобразования XML-документа в отображаемый пользователю вид:

  1. Применение стилей CSS ;
  2. Применение XSL ;
  3. Написание на каком-либо языке программирования обработчика XML-документа.

Для задания XSL трансформации (XSLT) на стороне клиента требуется наличие в XML инструкции следующего вида:

Словари XML

Так как XML является достаточно абстрактным языком, были разработаны словари XML.

Словарь позволяет разработчикам договориться о некотором конечном наборе имен тегов и атрибутов этих тегов. Одним из первых словарей является XHTML , который понимают большинство браузеров. XHTML часто используют для хранения и редактирования контента в CMS .

Были созданы более специализированные словари, например протокол передачи данных SOAP , который не является человеко-ориентированным и достаточно трудно читаем. Есть коммерческие словари, такие как CommerceML , xCBL и cXML которые используются для передачи данных, ориентированных на торговую деятельность, эти словари включают в себя описание системы заказов, поставщиков, продуктов и прочее.

Обычно, описывая какой-либо документ, человек для себя придумывает некоторый словарь, который потом описывается посредством DTD , XSD или просто объясняет «на пальцах» заинтересованным лицам.

Одним из словарей, получивших широкое распространение, является FB2 - словарь, описывающий формат книги, со всевозможными сносками, цитатами, даже картинками.

Версии XML

  • XML 1.0
  • XML 1.1

См. также

Примечания

Литература

  • Дэвид Хантер, Джефф Рафтер, Джо Фаусетт, Эрик ван дер Влист, и др. XML. Работа с XML, 4-е издание = Beginning XML, 4th Edition. - М .: «Диалектика», 2009. - 1344 с. - ISBN 978-5-8459-1533-7
  • Дэвид Хантер, Джефф Рафтер и др. XML. Базовый курс = Beginning XML. - М .: Вильямс, 2009. - 1344 с. - ISBN 978-5-8459-1533-7
  • Роберт Тейбор. Реализация XML Web-служб на платформе Microsoft .NET = Microsoft .NET XML Web Services. - М .: Вильямс, 2002. - 464 с. - ISBN 0-672-32088-6

Ссылки

  • XML на сайте Консорциума Всемирной паутины (W3C)
  • Официальная спецификация стандарта XML 1.0 (англ.)
  • Официальная спецификация стандарта XML 1.1 (англ.)
  • Документация по XML на сайте IBM статьи, форумы

вПТЙУ фПВПФТБУ

SGML: У ЮЕН ЬФП ЕДСФ?

уЕЗПДОС ЧУЕ ЮБЭЕ НПЦОП ЧУФТЕФЙФШ БВВТЕЧЙБФХТХ SGML. нОПЗЙЕ ЧЙДЩ ДПЛХНЕОФБГЙЙ РПУФБЧМСАФУС Ч ЖПТНБФЕ SGML. рПРХМСТОЩК СЪЩЛ ТБЪНЕФЛЙ Web-УФТБОЙГ HTML СЧМСЕФУС РТЙМПЦЕОЙЕН SGML. рПСЧМСЕФУС ЧУЕ ВПМШЫЕ РТЙЛМБДОЩИ РТПЗТБНН ДМС ТБВПФЩ У SGML: ТЕДБЛФПТЩ, УТЕДУФЧБ ЖПТНБФЙТПЧБОЙС, УЙУФЕНЩ ДПЛХНЕОФППВПТПФБ, ЙУРПМШЪХАЭЙЕ SGML Ч ЛБЮЕУФЧЕ ЖПТНБФБ ИТБОЕОЙС ДПЛХНЕОФПЧ... SGML-РТПДХЛФЩ ЧЩРХУЛБАФ Adobe, Corel, SoftQuad, Microsoft. ч SGML ЗПФПЧСФУС ЛОЙЗЙ ЙЪДБФЕМШУФЧБ O"Reilly, ФЕИОЙЮЕУЛБС ДПЛХНЕОФБГЙС IBM, Sun Й OSF. пУОПЧЩЧБЕФУС ОБ SGML ЙОЖПТНБГЙПООБС ФЕИОПМПЗЙС НОПЗЙИ ЧЕДХЭЙИ НБЫЙОПУФТПЙФЕМШОЩИ Й БЧЙБЛПУНЙЮЕУЛЙИ ЖЙТН ЧУЕЗП НЙТБ.

рПСЧЙЧЫБСУС Ч ОБЮБМЕ ЧПУШНЙДЕУСФЩИ SGML-ФЕИОПМПЗЙС РЕТЕЦЙЧБЕФ УЕКЮБУ РЕТЙПД ТБУГЧЕФБ. юФП ЬФП ФБЛПЕ? юФП ПОБ ДБЕФ УЧПЙН РПМШЪПЧБФЕМСН? лБЛ У ОЕК ТБВПФБФШ? оБ ЬФЙ Й ДТХЗЙЕ ЧПРТПУЩ С РЩФБАУШ ПФЧЕФЙФШ ЬФПК УФБФШЕК.

уПДЕТЦБОЙЕ





















лБЛ С ОБВТЕМ ОБ SGML-ФЕИОПМПЗЙА

чУЕ ОБЮБМПУШ У ЙОФТБОЕФБ. ьФП НПДОПЕ УМПЧП ПЪОБЮБМП ДМС НЕОС ОБ РТБЛФЙЛЕ ФП, ЮФП ДПЛХНЕОФЩ, ЛПФПТЩЕ С ТЕЗХМСТОП РЙУБМ РП ТПДХ УЧПЕК ДЕСФЕМШОПУФЙ, УФБМП НПЦОП Й ОХЦОП ДЕМБФШ ДПУФХРОЩНЙ "online". дП УЙИ РПТ С РТПУФП ОБВЙТБМ ДПЛХНЕОФЩ Ч T E X-e Й РЕЮБФБМ ЙИ ОБ ВХНБЗЕ. йДЕС ДХВМЙТПЧБФШ ЙИ Ч HTML ЧТХЮОХА ПФРБМБ УТБЪХ: ОЕНЕДМЕООП ЧПЪОЙЛМБ ВЩ РТПВМЕНБ УЙОИТПОЙЪБГЙЙ ВХНБЦОПК Й ЬМЕЛФТПООПК ЧЕТУЙК ПДОПЗП Й ФПЗП ЦЕ ДПЛХНЕОФБ.

б ЧУЛПТЕ РПФТЕВПЧБМПУШ РЕТЙПДЙЮЕУЛБС РЕТЕДБЮБ ДПЛХНЕОФПЧ РПУФПТПООЙН МАДСН Ч ЬМЕЛФТПООПК ЖПТНЕ, ЮФП, РП УМПЦЙЧЫЕКУС Х ОБУ РТБЛФЙЛЕ, ПЪОБЮБЕФ -- Ч ЖПТНБФЕ Microsoft Word. тБВПФБФШ У MS Word Х НЕОС РП ТСДХ РТЙЮЙО ОЕ ВЩМП ОЙЛБЛПЗП ЦЕМБОЙС, Л ФПНХ ЦЕ ЬФП ФПМШЛП ХУХЗХВЙМП ВЩ РТПВМЕНХ УЙОИТПОЙЪБГЙЙ ЧЕТУЙК.

ъОБЮЙФ, ОХЦОП ВЩМП РТЙДХНБФШ УРПУПВ БЧФПНБФЙЮЕУЛПЗП РТЕПВТБЪПЧБОЙС ОБВЙТБЕНЩИ ДПЛХНЕОФПЧ Ч ТБЪМЙЮОЩЕ ЖПТНБФЩ: T E X-a -- ДМС РЕЮБФЙ ОБ ВХНБЗЕ, HTML -- ДМС РПНЕЭЕОЙС ОБ WWW УЕТЧЕТ, Word -- ДМС ПВНЕОБ У ТБВПФБАЭЙНЙ Ч Windows. лТПНЕ ФПЗП, НОЕ ИПФЕМПУШ, ЮФПВЩ ФБЛПЕ УТЕДУФЧП ПФЧЕЮБМП ЕЭЕ ТСДХ ФТЕВПЧБОЙК:

  • ВЩФШ НПДХМШОЩН, ЮФПВЩ НПЦОП ВЩМП РТЙ ОЕПВИПДЙНПУФЙ МЕЗЛП ДПВБЧМСФШ ОПЧЩЕ ЧЩИПДОЩЕ ЖПТНБФЩ ЙМЙ ЙЪНЕОСФШ БМЗПТЙФНЩ РТЕПВТБЪПЧБОЙС Ч УХЭЕУФЧХАЭЙЕ;
  • ВЩФШ ПФЛТЩФЩН, ВЕУРМБФОЩН, ЛБЛ НПЦОП НЕОШЫЕ РТЙЧСЪБООЩН Л ЛПОЛТЕФОЩН РТПЗТБННБН;
  • ВЩФШ НПВЙМШОЩН: ТБВПФБФШ, ЛБЛ НЙОЙНХН, ОБ ТБЪОЩИ UNIX-РМБФЖПТНБИ;
  • ВЩФШ МЕЗЛП ТХУЙЖЙГЙТХЕНЩН.

рЕТЧЩН, ЮФП РПРБМПУШ НОЕ РПД ТХЛХ РПУМЕ РПИПДБ ОБ Altavista , ПЛБЪБМУС РБЛЕФ РПД ОБЪЧБОЙЕН linuxdoc-sgml . пО ЛБЛ ТБЪ Й РТЕДОБЪОБЮБМУС ДМС ЗЕОЕТБГЙЙ HTML, T E X Й RTF ЙЪ ПДОПЗП ЧИПДОПЗП ЖБКМБ. ыЙТПЛП ЙУРПМШЪХЕНЩК Ч ТБНЛБИ Linux Documentation Project , ПО ЙУРПМШЪПЧБМ Ч ЛБЮЕУФЧЕ ЧИПДОПЗП ЖПТНБФБ ОЕЪОБЛПНЩК НОЕ ДП УЙИ РПТ СЪЩЛ SGML . чРТПЮЕН, ОЙЮЕЗП УМПЦОПЗП Ч ОЕН ОЕ ПЛБЪБМПУШ -- ПО ЧЕУШНБ ОБРПНЙОБМ ЪОБЛПНЩК НОЕ HTML Й ЧЩЗМСДЕМ ЧРПМОЕ РПОСФОП. чПФ, Л РТЙНЕТХ, ЛХУПЮЕЛ SGML-ДПЛХНЕОФБ:

The Structure of a TEI Text

All TEI-conformant texts contain a TEI header (marked up as a teiHeader element) and the transcription of the text proper (marked up as a text element).

дМС ФПЗП, ЮФПВЩ ОБЮБФШ ОБ ЬФПН РЙУБФШ, РПФТЕВПЧБМПУШ ЧУЕЗП МЙЫШ ЪБРПНОЙФШ ОЕУЛПМШЛП ПУОПЧОЩИ ЬМЕНЕОФПЧ ТБЪНЕФЛЙ, ОБРТЙНЕТ, ЮФП

ПЪОБЮБЕФ ОБЮБМП РБТБЗТБЖБ, -- ОБЮБМП РЕТЕЮЙУМЕОЙС Й Ф.Р.

оБВТБООЩК Ч SGML ФЕЛУФ ДБМЕЕ ЪБРХУЛПН ПДОПЗП ЖЙМШФТБ РТЕПВТБЪХЕФУС Ч HTML, ДТХЗПЗП -- Ч T E X, ФТЕФШЕЗП -- Ч RTF, Й ФБЛ ДБМЕЕ.

юФП ФБЛПЕ SGML Й ЮЕН ПО ИПТПЫ

фЕТНЙОПМПЗЙС

GML (Generalized Markup Language ) ТБЪТБВПФБО Ч ОЕДТБИ ЧЕЪДЕУХЭЕК ЛПТРПТБГЙЙ IBM. еЗП ОБУМЕДОЙЛ SGML (Standard Generalized Markup Language ) РТЙОСФ Ч 1986 ЗПДХ Ч ЛБЮЕУФЧЕ НЕЦДХОБТПДОПЗП УФБОДБТФБ ДМС ПРТЕДЕМЕОЙС ОЕЪБЧЙУЙНЩИ ПФ ХУФТПКУФЧ ЧЧПДБ/ЧЩЧПДБ, ОЕЪБЧЙУЙНЩИ ПФ ЧЩЮЙУМЙФЕМШОПК УТЕДЩ НЕФПДПЧ РТЕДУФБЧМЕОЙС ФЕЛУФПЧ Ч ЬМЕЛФТПООПК ЖПТНЕ. вПМЕЕ ФПЮОП, SGML -- ЬФП НЕФБСЪЩЛ , ФП ЕУФШ УТЕДУФЧП ЖПТНБМШОПЗП ПРЙУБОЙС СЪЩЛБ, Ч ДБООПН УМХЮБЕ, СЪЩЛБ ТБЪНЕФЛЙ .

йУФПТЙЮЕУЛЙ УМПЧП ТБЪНЕФЛБ ЙУРПМШЪПЧБМПУШ ДМС ПРЙУБОЙК БООПФБГЙК ЙМЙ ДТХЗЙИ ПВПЪОБЮЕОЙК ЧОХФТЙ ФЕЛУФБ, РТЕДОБЪОБЮЕООЩИ ДМС ХЛБЪБОЙК УПУФБЧЙФЕМА ЙМЙ "ЧЕТУФБМШЭЙЛХ" ФПЗП, ЛБЛ ЙНЕООП ЛПОЛТЕФОПЕ НЕУФП ДПМЦОП ВЩФШ ОБРЕЮБФБОП ЙМЙ УЧЕТУФБОП. рТЙНЕТЩ ЧЛМАЮБАФ РПДЮЕТЛЙЧБОЙЕ ЧПМОЙУФПК ЮЕТФПК, ПВПЪОБЮБАЭЕЕ ЛХТУЙЧ, УРЕГЙБМШОЩЕ ЪОБЮЛЙ ДМС РТПРХУЛБ ЖТБЪ ЙМЙ ЙИ РЕЮБФЙ ЛПОЛТЕФОЩН ЫТЙЖФПН, Й ФБЛ ДБМЕЕ. лПЗДБ ЖПТНБФЙТПЧБОЙЕ Й РЕЮБФШ ФЕЛУФПЧ УФБМЙ БЧФПНБФЙЪЙТПЧБООЩНЙ, ЬФПФ ФЕТНЙО УФБМ ПИЧБФЩЧБФШ ЧУЕ ЧЙДЩ УРЕГЙБМШОЩИ ЛПДПЧ ТБЪНЕФЛЙ , ЧУФБЧМСЕНЩИ Ч ЬМЕЛФТПООЩЕ ФЕЛУФЩ ДМС ХРТБЧМЕОЙС ЖПТНБФЙТПЧБОЙЕН, РЕЮБФША ЙМЙ ДТХЗПК ПВТБВПФЛПК.

пВПВЭБС, ТБЪНЕФЛХ, ЙМЙ ЛПДЙТПЧЛХ , ПРТЕДЕМСАФ ЛБЛ МАВПЕ УТЕДУФЧП УДЕМБФШ СЧОЩН ЙОФЕТРТЕФБГЙА ФЕЛУФБ. оБ ВБОБМШОПН ХТПЧОЕ ЧУЕ ОБРЕЮБФБООЩЕ ФЕЛУФЩ ЛПДЙТПЧБОЩ Ч ЬФПН УНЩУМЕ: ЪОБЛЙ РТЕРЙОБОЙС, ЙУРПМШЪПЧБОЙЕ ЪБЗМБЧОЩИ ВХЛЧ, ТБУРПМПЦЕОЙЕ ВХЛЧ РП УФТБОЙГЕ, ДБЦЕ ЙОФЕТЧБМЩ НЕЦДХ УМПЧБНЙ НПЦОП УЮЙФБФШ Ч ЛБЛПК-ФП УФЕРЕОЙ ТБЪНЕФЛПК, ЖХОЛГЙС ЛПФПТПК -- РПНПЮШ ЮЕМПЧЕЛХ, ЮЙФБАЭЕНХ ФЕЛУФ, ПРТЕДЕМЙФШ, ЗДЕ ЛПОЮБЕФУС ПДОП УМПЧП Й ОБЮЙОБЕФУС ДТХЗПЕ, ЙМЙ ЛБЛ ЙДЕОФЙЖЙГЙТПЧБФШ ПУПВЕООПУФЙ УФТХЛФХТЩ, ФБЛЙЕ ЛБЛ ЪБЗПМПЧЛЙ, ЙМЙ РТПУФЩЕ УЙОФБЛУЙЮЕУЛЙЕ ЕДЙОЙГБ ЧТПДЕ РПДЮЙОЕООЩИ РТЕДМПЦЕОЙК. лПДЙТПЧБОЙЕ ФЕЛУФБ ДМС ЛПНРШАФЕТОПК ПВТБВПФЛЙ, Ч РТЙОГЙРЕ, ЛБЛ ТБУЫЙЖТПЧЛБ НБОХУЛТЙРФБ У РЕТЗБНЕОФБ, -- РТПГЕУУ ДЕМБОЙС СЧОЩН ОЕСЧОПЗП ЙМЙ РПДТБЪХНЕЧБЕНПЗП, РТПГЕУУ ХЛБЪБОЙС РПМШЪПЧБФЕМА ФПЗП, ЛБЛ ДПМЦОП ЙОФЕТРТЕФЙТПЧБФШУС УПДЕТЦЙНПЕ ФЕЛУФБ.

рПД СЪЩЛПН ТБЪНЕФЛЙ РПОЙНБАФ ОБВПТ УПЗМБЫЕОЙК П ТБЪНЕФЛЕ, РТЙНЕОСЕНЩИ ДМС ЛПДЙТПЧБОЙС ФЕЛУФПЧ. сЪЩЛ ТБЪНЕФЛЙ ДПМЦЕО УРЕГЙЖЙГЙТПЧБФШ, ЛБЛБС ТБЪНЕФЛБ ДПРХУФЙНБ, ЛБЛБС ТБЪНЕФЛБ ПВСЪБФЕМШОБ, ЛБЛ ПФМЙЮЙФШ ТБЪНЕФЛХ ПФ ФЕЛУФБ Й ЮФП ТБЪНЕФЛБ ЪОБЮЙФ. SGML РТЕДПУФБЧМСЕФ ТЕЫЕОЙС ДМС РЕТЧЩИ ФТЕИ ЪБДБЮ, ПФДЕМШОБС ДПЛХНЕОФБГЙС ПВЩЮОП ОЕПВИПДЙНБ ДМС РПУМЕДОЕК.

пУПВЕООПУФЙ SGML

фТЙ ИБТБЛФЕТЙУФЙЛЙ SGML ПФМЙЮБАФ ЕЗП ПФ РТПЮЙИ СЪЩЛПЧ ТБЪНЕФЛЙ.

пРЙУБФЕМШОБС ТБЪНЕФЛБ

уЙУФЕНБ У ПРЙУБФЕМШОПК ТБЪНЕФЛПК ЙУРПМШЪХЕФ ЛПДЩ ТБЪНЕФЛЙ, ЛПФПТЩЕ РТПУФП РТЕДПУФБЧМСАФ ОБЪЧБОЙС ДМС ЛБФЕЗПТЙЪБГЙЙ ЮБУФЕК ДПЛХНЕОФБ. лПДЩ ТБЪНЕФЛЙ, ФБЛЙЕ ЛБЛ ЙМЙ \end{list} , РТПУФП ЙДЕОФЙЖЙГЙТХАФ РПТГЙА ДПЛХНЕОФБ Й ХФЧЕТЦДБАФ, ЮФП "ПОБ СЧМСЕФУС РБТБЗТБЖПН", ЙМЙ ЮФП "ЬФП -- ЛПОЕГ РПУМЕДОЙН ОБЮБФПЗП УРЙУЛБ" Й Ф.Р. у ДТХЗПК УФПТПОЩ, УЙУФЕНБ У РТПГЕДХТОПК ТБЪНЕФЛПК ПРТЕДЕМСЕФ, ЛБЛБС ПВТБВПФЛБ ДПМЦОБ ЧЩРПМОСФШУС Ч ЛПОЛТЕФОПК ФПЮЛЕ ДПЛХНЕОФБ: "Ч ЬФПН НЕУФЕ ЧЩЪЧБФШ РТПГЕДХТХ PARA У РБТБНЕФТБНЙ 1, b Й x", ЙМЙ "РЕТЕДЧЙОХФШ МЕЧХА ЗТБОЙГХ ОБ 2НН МЕЧЕЕ, РТБЧХА ЗТБОЙГХ -- ОБ 2НН РТБЧЕЕ, РТПРХУФЙФШ ПДОХ УФТПЛХ Й ЧУФБФШ ОБ ОПЧХА МЕЧХА ЗТБОЙГХ" Й Ф.Р. ч SGML ЙОУФТХЛГЙЙ, ОЕПВИПДЙНЩЕ ДМС ПВТБВПФЛЙ ДПЛХНЕОФБ У ЛБЛПК-МЙВП ЛПОЛТЕФОПК ГЕМША (ОБРТЙНЕТ, ДМС ЖПТНБФЙТПЧБОЙС), ЮЕФЛП ПФДЕМСАФУС ПФ ПРЙУБФЕМШОПК ТБЪНЕФЛЙ, ЛПФПТБС ЧУФТЕЮБЕФУС ЧОХФТЙ ДПЛХНЕОФБ. пВЩЮОП ПОЙ УПВТБОЩ ЧОЕ ДПЛХНЕОФБ Ч ПФДЕМШОЩИ РТПГЕДХТБИ ЙМЙ РТПЗТБННБИ.

у ПРЙУБФЕМШОПК, Б ОЕ РТПГЕДХТОПК, ТБЪНЕФЛПК ПДЙО Й ФПФ ЦЕ ДПЛХНЕОФ НПЦЕФ ВЩФШ ПВТБВПФБО ТБЪОППВТБЪОЩНЙ РТПЗТБННБНЙ, ЛБЦДБС ЙЪ ЛПФПТЩИ НПЦЕФ РТЙНЕОСФШ ТБЪМЙЮОЩЕ ЙОУФТХЛГЙЙ ПВТБВПФЛЙ Л ФЕН ЕЗП ЮБУФСН, ЛПФПТЩЕ ПОБ УЮЙФБЕФ ЧБЦОЩНЙ. оБРТЙНЕТ, РТПЗТБННБ БОБМЙЪБ УПДЕТЦЙНПЗП НПЦЕФ РПМОПУФША ЙЗОПТЙТПЧБФШ УОПУЛЙ, ФПЗДБ ЛБЛ РТПЗТБННБ ЖПТНБФЙТПЧБОЙС НПЦЕФ ЙЪЧМЕЛБФШ Й УПВЙТБФШ ЙИ ДМС РЕЮБФШ Ч ЛПОГЕ ЛБЦДПК ЮБУФЙ. тБЪМЙЮОЩЕ ЧЙДЩ ЙОУФТХЛГЙК ПВТБВПФЛЙ НПЗХФ БУУПГЙЙТПЧБФШУС У ПДОПК Й ФПК ЦЕ ЮБУФША ЖБКМБ. оБРТЙНЕТ, ПДОБ РТПЗТБННБ НПЦЕФ ЙЪЧМЕЛБФШ ЙЪ ДПЛХНЕОФБ ЖБНЙМЙЙ МАДЕК Й ЗЕПЗТБЖЙЮЕУЛЙЕ ОБЪЧБОЙС ДМС УПЪДБОЙС ЙОДЕЛУБ ЙМЙ ВБЪЩ ДБООЩИ, ФПЗДБ ЛБЛ ДТХЗБС, ПВТБВБФЩЧБАЭБС ФПФ ЦЕ УБНЩК ФЕЛУФ, НПЦЕФ РЕЮБФБФШ ЖБНЙМЙЙ Й ОБЪЧБОЙС ПФМЙЮБАЭЙНУС ЫТЙЖФПН.

фЙРЩ ДПЛХНЕОФПЧ

SGML ЧЧПДЙФ РПОСФЙЕ ФЙРБ ДПЛХНЕОФБ , Й, УППФЧЕФУФЧЕООП, ПРТЕДЕМЕОЙС ФЙРБ ДПЛХНЕОФБ (document type definition, DTD ). дПЛХНЕОФЩ УЮЙФБАФУС ФЙРЙЪЙТПЧБООЩНЙ, ФБЛ ЦЕ, ЛБЛ Й ДТХЗЙЕ ПВТБВБФЩЧБЕНЩЕ ЛПНРШАФЕТБНЙ ПВЯЕЛФЩ. фЙР ДПЛХНЕОФБ ЖПТНБМШОП ПРТЕДЕМСЕФУС ЕЗП УПУФБЧОЩНЙ ЮБУФСНЙ Й ЙИ УФТХЛФХТПК. пРТЕДЕМЕОЙЕ, ОБРТЙНЕТ, ПФЮЕФБ НПЦЕФ ВЩФШ ФБЛЙН, ЮФП ПО УПУФПЙФ ЙЪ ЪБЗПМПЧЛБ Й, ЧПЪНПЦОП, БЧФПТБ, ЪБ ЛПФПТЩНЙ УМЕДХЕФ БООПФБГЙС Й РПУМЕДПЧБФЕМШОПУФШ ПДОПЗП ЙМЙ ВПМЕЕ БВЪБГЕЧ. мАВПК ДПЛХНЕОФ Ч ПФУХФУФЧЙЕ ЪБЗПМПЧЛБ, Ч УППФЧЕФУФЧЙЙ У ЬФЙН ЖПТНБМШОЩН ПРТЕДЕМЕОЙЕН, ОЕ ВХДЕФ ЖПТНБМШОП СЧМСФШУС ПФЮЕФПН, ФБЛ ЦЕ ЛБЛ ОЕ ВХДЕФ ЙН СЧМСФШУС Й РПУМЕДПЧБФЕМШОПУФШ БВЪБГЕЧ, ЪБ ЛПФПТПК УМЕДХЕФ БООПФБГЙС, ОЕЧЪЙТБС ОБ ФП, ОБУЛПМШЛП РПИПЦ ОБ ПФЮЕФ ФБЛПК ДПЛХНЕОФ У ФПЮЛЙ ЪТЕОЙС ЮЙФБФЕМС-ЮЕМПЧЕЛБ.

рПУЛПМШЛХ ДПЛХНЕОФЩ ПФОПУСФУС Л ЙЪЧЕУФОЩН ФЙРБН, НПЦОП ЙУРПМШЪПЧБФШ УРЕГЙБМШОХА РТПЗТБННХ, ОБЪЩЧБЕНХА БОБМЙЪБФПТПН (parser ), ДМС ФПЗП, ЮФПВЩ ПВТБВПФБФШ ДПЛХНЕОФ, ХФЧЕТЦДБАЭЙК, ЮФП ПО ПФОПУЙФУС Л ЛПОЛТЕФОПНХ ФЙРХ, Й РТПЧЕТЙФШ, ДЕКУФЧЙФЕМШОП МЙ ЧУЕ ЬМЕНЕОФЩ, ФТЕВХЕНЩЕ ДМС ДБООПЗП ФЙРБ ДПЛХНЕОФПЧ, РТЙУХФУФЧХАФ Й ОБИПДСФУС Ч РТБЧЙМШОПК РПУМЕДПЧБФЕМШОПУФЙ. юФП ЕЭЕ ВПМЕЕ ЧБЦОП, ТБЪОЩЕ ДПЛХНЕОФЩ ПДОПЗП ФЙРБ НПЗХФ ПВТБВБФЩЧБФШУС ХОЙЖЙГЙТПЧБООЩН ПВТБЪПН. нПЦОП РЙУБФШ ВПМЕЕ ЙОФЕММЕЛФХБМШОЩЕ РТПЗТБННЩ, ЙУРПМШЪХАЭЙЕ ЪОБОЙС, ЪБЛМАЮЕООЩЕ Ч ЙОЖПТНБГЙПООПК УФТХЛФХТЕ ДПЛХНЕОФБ.

оЕЪБЧЙУЙНПУФШ ДБООЩИ

пУОПЧОБС ГЕМШ РТПЕЛФЙТПЧБОЙС SGML ВЩМБ Ч УПЪДБОЙЙ ЗБТБОФЙК ФПЗП, ЮФП ДПЛХНЕОФ, ЪБЛПДЙТПЧБООЩК УПЗМБУОП ЕЗП РПМПЦЕОЙСН, ВХДЕФ РЕТЕОПУЙНЩН У ПДОПК БРРБТБФОПК Й РТПЗТБННОПК УТЕДЩ Ч ДТХЗХА ВЕЪ РПФЕТЙ ЙОЖПТНБГЙЙ. дЧБ ЕЗП УЧПКУФЧБ, ПРЙУБООЩИ ЧЩЫЕ, ПФЧЕЮБАФ ЬФПНХ ФТЕВПЧБОЙА ОБ БВУФТБЛФОПН ХТПЧОЕ; ФТЕФШЕ УЧПКУФЧП -- ОБ ХТПЧОЕ УФТПЮЕЛ ВБКФПЧ (УЙНЧПМПЧ), ЛПФПТЩЕ УПУФБЧМСАФ ДПЛХНЕОФ. SGML РТЕДПУФБЧМСЕФ ПВПВЭЕООЩК НЕИБОЙЪН УФТПЛПЧПК РПДУФБОПЧЛЙ , ФП ЕУФШ, РТПУФПК НБЫЙООП-ОЕЪБЧЙУЙНЩК УРПУПВ ХЛБЪБОЙС, ЮФП ЛПОЛТЕФОБС УФТПЛБ УЙНЧПМПЧ Ч ДПЛХНЕОФЕ Ч НПНЕОФ ПВТБВПФЛЙ ДПЛХНЕОФБ ДПМЦОБ ЪБНЕОСФШУС ОБ ОЕЛПФПТХА ДТХЗХА УФТПЛХ. пДОП ПЮЕЧЙДОПЕ РТЙНЕОЕОЙЕ ЬФПНХ НЕИБОЙЪНХ -- ПВЕУРЕЮЕОЙЕ ЕДЙОПК ФЕТНЙОПМПЗЙЙ; ДТХЗПЕ, Й ВПМЕЕ ЪОБЮЙФЕМШОПЕ, -- РТПФЙЧПДЕКУФЧЙЕ ЙЪЧЕУФОПК ОЕУРПУПВОПУФЙ ТБЪОЩИ ЛПНРШАФЕТОЩИ УЙУФЕН РПОЙНБФШ ОБВПТЩ УЙНЧПМПЧ ДТХЗ ДТХЗБ, ОБРТЙНЕТ, ПДОПК УЙУФЕНЕ РТЕДУФБЧМСФШ ЧУЕ ЗТБЖЙЮЕУЛЙЕ УЙНЧПМЩ, ОЕПВИПДЙНЩЕ РТЙМПЦЕОЙА, РХФЕН ПРЙУБФЕМШОПЗП ПФПВТБЦЕОЙС ОЕРЕТЕДБЧБЕНЩИ УЙНЧПМПЧ. уФТПЛЙ, ПРТЕДЕМСЕНЩЕ ЬФЙН НЕИБОЙЪНПН, ОБЪЩЧБАФУС УХЭОПУФСНЙ (entities).

п РТЕЙНХЭЕУФЧБИ

юФП ДБЕФ ЙУРПМШЪПЧБОЙЕ SGML Ч ТЕБМШОПК ЦЙЪОЙ? нОЕ ПОП УТБЪХ ДБМП ЧПЪНПЦОПУФШ РТПЙЪЧПДЙФШ ДПЛХНЕОФЩ Ч МАВПН ФТЕВХЕНПН ЧЙДЕ. хДПВОП ПЛБЪБМПУШ Й ОБРЙУБОЙЕ "ЧПТДПЧЩИ" ВХНБЦЕЛ Ч РТЙЧЩЮОПК УТЕДЕ XEmacs ВЕЪ ЙУРПМШЪПЧБОЙС Windows. чУЕ ЙУРПМШЪПЧБООЩЕ РТПЗТБННЩ -- ВЕУРМБФОЩ Й ТБУРТПУФТБОСАФУС Ч ЙУИПДОЩИ ФЕЛУФБИ, ЮФП РПЪЧПМЙМП ХУФБОПЧЙФШ ЙИ ОБ ЧУЕИ ЙУРПМШЪХЕНЩИ НОПК УЙУФЕНБИ. рТЙЮЕН ПЛБЪБМПУШ, ЮФП ОБЮБФШ ТБВПФБФШ У SGML ЧПЧУЕ ОЕ УМПЦОП, ЛБЦДЩК, ЛФП ИПФШ ТБЪ ТЕДБЛФЙТПЧБМ WWW УФТБОЙЮЛХ, ОЕ ЙУРХЗБЕФУС ЧЙДБ ЛПОУФТХЛГЙК SGML.

рПФПН ХЦЕ, РП НЕТЕ РПУФЕРЕООПЗП ЙЪХЮЕОЙС SGML, С ПУПЪОБМ, ЮФП ЬФБ ФЕИОЙЛБ ДБЕФ ЗТПНБДОПЕ ЛПМЙЮЕУФЧП ЧПЪНПЦОПУФЕК РП УТБЧОЕОЙА У ФЙРЙЮОПК "ОБУФПМШОПК ФЙРПЗТБЖЙЕК":

рТПДХЛФЙЧОПУФШ юЕФЛП ТБЪДЕМЕООЩЕ РТПГЕУУЩ ЧЧПДБ ЙОЖПТНБГЙЙ Й ЕЕ ЖПТНБФЙТПЧБОЙС РПЪЧПМСАФ БЧФПТХ УПУТЕДПФПЮЙФШУС ОБ ЙЪМПЦЕОЙЙ НЩУМЕК, ОЕ ПФЧМЕЛБСУШ ОБ ДЧЙЗБОЙЕ ФЕЛУФБ РП ЬЛТБОХ Й РПДВПТ УФЙМЕК.

еДЙОБС УФЙМЙУФЙЛБ мЕЗЛП ЧЩДЕТЦЙЧБФШ ТБЪМЙЮОЩЕ ДПЛХНЕОФЩ Ч ЕДЙОПН УФЙМЕ, ЙУРПМШЪХС ЕДЙОХА ФЕТНЙОПМПЗЙА. еУМЙ УФЙМШ ЙМЙ ФЕТНЙОЩ ОХЦОП ЙЪНЕОЙФШ, ЬФП ДЕМБЕФУС ТБЪПН ЧП ЧУЕИ ДПЛХНЕОФБИ, ОЕ ФТПЗБС ЙИ УПДЕТЦЙНПЕ.

рПЧФПТОПЕ ЙУРПМШЪПЧБОЙЕ ьФПФ ФЕТНЙО, ИПТПЫП ЪОБЛПНЩК РТПЗТБННЙУФБН, ПЪОБЮБЕФ ОБМЙЮЙЕ ЧПЪНПЦОПУФЙ ЙУРПМШЪПЧБФШ ДЕФБМЙ УФБТЩИ РТПЕЛФПЧ Ч ОПЧЩИ, У НЙОЙНБМШОЩНЙ ЙЪНЕОЕОЙСНЙ. юБУФШ ДПЛХНЕОФБ, ПЖПТНМЕООБС Ч ЧЙДЕ SGML-ЬМЕНЕОФБ, НПЦЕФ РЕТЕОПУЙФШУС Ч ДТХЗЙЕ ДПЛХНЕОФЩ, МЕЗЛП РПЧФПТСФШУС Ч ТБЪОЩИ НЕУФБИ ФЕЛУФБ.

дПМЗПЧЕЮОПУФШ ЙОЖПТНБГЙЙ йЪ-ЪБ ФПЗП, ЮФП SGML -- РТПУФПК Й УФБОДБТФОЩК ЖПТНБФ ИТБОЕОЙС ДБООЩИ, ПФУХФУФЧХЕФ ОЕПВИПДЙНПУФШ РЕТЕЖПТНБФЙТПЧБФШ ЙИ ЧЧЙДХ ХУФБТЕЧБОЙС БРРБТБФОПК ЙМЙ РТПЗТБННОПК РМБФЖПТНЩ. йОЖПТНБГЙС РТПУФП ДПУФХРОБ ОБЧУЕЗДБ. пОБ ОЕУЕФ У УПВПК ЧУЕ ОЕПВИПДЙНПЕ ДМС УПЪДБОЙС ДПЛХНЕОФБ.

мХЮЫЕЕ ХРТБЧМЕОЙЕ ДБООЩНЙ у SGML НПЦОП ПРТЕДЕМСФШ ЙОЖПТНБГЙПООЩЕ ЬМЕНЕОФЩ Й НБОЙРХМСГЙЙ У ОЙНЙ У РТПЙЪЧПМШОПК УФЕРЕОША ДЕФБМШОПУФЙ. тБЪНЕЮЕООЩЕ ЬМЕНЕОФЩ НПЗХФ ЙНЕФШ БФТЙВХФЩ, ПРТЕДЕМСАЭЙЕ ИБТБЛФЕТЙУФЙЛЙ Й УЧПКУФЧБ ЬМЕНЕОФПЧ. ьФБ ЙОЖПТНБГЙС ОЕ РТЕДОБЪОБЮЕОБ ДМС РЕЮБФЙ, ОП НПЦЕФ РПНПЮШ Ч ХРТБЧМЕОЙЙ ЬМЕНЕОФБНЙ ДБООЩИ. оБРТЙНЕТ, БФТЙВХФ ID (ЙДЕОФЙЖЙЛБФПТ) НПЦЕФ ХОЙЛБМШОЩН ПВТБЪПН ЙДЕОФЙЖЙГЙТПЧБФШ ПДЙО БВЪБГ, ЙМЙ ГЕМЩК ТБЪДЕМ, РТЙНЕЮБОЙЕ, ЙММАУФТБГЙА, ЪБДБОЙЕ, -- МАВПК ЬМЕНЕОФ, ЛБЛ Ч ЬФПН РТЙНЕТЕ:

йОЖПТНБГЙС
фБЛ ЛБЛ ЙДЕОФЙЖЙЛБФПТЩ СЧМСАФУС НБЫЙООП-ЮЙФБЕНЩНЙ, ПОЙ НПЗХФ УЧСЪЩЧБФШ НЕЦДХ УПВПК ЙОЖПТНБГЙА Й ЙУРПМШЪПЧБФШУС ДМС ТБЪОППВТБЪОПЗП ХРТБЧМЕОЙС ЕК. оБРТЙНЕТ:
  • лПОФТПМЙТПЧБФШ ВЕЪПРБУОПУФШ ДПУФХРБ Л ЙОЖПТНБГЙЙ, РПЪЧПМСС ФПМШЛП ПРТЕДЕМЕООЩН МАДСН РТПУНБФТЙЧБФШ ЙМЙ ЙЪНЕОСФШ ЕЕ.
  • бЧФПНБФЙЪЙТПЧБФШ РЕТЕНЕЭЕОЙЕ ЙОЖПТНБГЙЙ -- ОБРТЙНЕТ, ПВОПЧМЕОЙЕ ДБООЩИ Ч ПДОПН НЕУФЕ НПЦЕФ ЙОЙГЙЙТПЧБФШ ПВОПЧМЕОЙЕ ФПК ЦЕ ЙОЖПТНБГЙЙ Ч ДТХЗЙИ РТЙМПЦЕОЙСИ.

тБЪДЕМСЕНПУФШ чПЪНПЦОПУФШ ТБВПФЩ УП УФТХЛФХТЙТПЧБООЩНЙ ЛПНРПОЕОФБНЙ ДПЛХНЕОФБ РПЪЧПМСЕФ УФТПЙФШ ГЕМЩК ДПЛХНЕОФ ЙЪ УПУФБЧОЩИ ЮБУФЕК, ТБЪВТПУБООЩИ РП ПТЗБОЙЪБГЙЙ. ьФП РПЪЧПМСЕФ РПМШЪПЧБФЕМСН ДЕМЙФШУС ЙОЖПТНБГЙЕК ВЕЪ ЕЕ ДХВМЙТПЧБОЙС.

нПВЙМШОПУФШ ч ЙОЖПТНБГЙПООЩИ УЕФСИ, ПВЯЕДЙОСАЭЙИ ТБЪОППВТБЪОЩЕ ЛПНРШАФЕТЩ, ПРЕТБГЙПООЩЕ УЙУФЕНЩ Й РТЙМПЦЕОЙС, НПВЙМШОПУФШ УФБОПЧЙФУС ЛМАЮПН ЛП ЧУЕПВЭЕК ДПУФХРОПУФЙ ЙОЖПТНБГЙЙ. рПУЛПМШЛХ SGML ОЕ ЪБЧЙУЙФ ПФ БРРБТБФХТЩ Й РТЙМПЦЕОЙК, НПЦОП МЕЗЛП ПВНЕОЙЧБФШУС ДПЛХНЕОФБНЙ НЕЦДХ ТБЪМЙЮОЩНЙ УЙУФЕНБНЙ.

зЙВЛПУФШ Ч РТЙМПЦЕОЙЙ SGML РПЪЧПМСЕФ ЙУРПМШЪПЧБФШ ЙОЖПТНБГЙА ДБМЕЛП ЪБ ТБНЛБНЙ "ОБУФПМШОПК ФЙРПЗТБЖЙЙ". оБРТЙНЕТ:

  • УФТБОЙГЩ WWW;
  • ЙОЖПТНБГЙПООЩЕ ВБЪЩ ДБООЩИ;
  • ДЙБЗОПУФЙЮЕУЛЙЕ / ЬЛУРЕТФОЩЕ УЙУФЕНЩ;
  • ЬМЕЛФТПООБС РПЮФБ;
  • ЗЙРЕТФЕЛУФПЧБС ДПЛХНЕОФБГЙС;
  • РХВМЙЛБГЙЙ ОБ CD-ROM;
  • ЙОФЕТБЛФЙЧОЩЕ ЬМЕЛФТПООЩЕ НБОХБМЩ.

рПЮЕНХ SGML?

рПЮЕНХ ОЕ Word? рПФПНХ, ЮФП ЬФП ЪБЛТЩФЩК ЖПТНБФ. рПФПНХ, ЮФП ЬФП ЖПТНБФ ПДОПЗП РТЙМПЦЕОЙС. рПФПНХ, ЮФП ЬФПЗП РТЙМПЦЕОЙС ОЕФ РПД АОЙЛУБНЙ, У ЛПФПТЩНЙ С ТБВПФБА. рПФПНХ, ЮФП ЬФП ОЕ ФЕЛУФПЧЩК ЖПТНБФ. рПФПНХ, ЮФП ОЕФ УТЕДУФЧ БЧФПНБФЙЮЕУЛПК ЗЕОЕТБГЙЙ ФБЛЙИ ДПЛХНЕОФПЧ. рПФПНХ, ЮФП ОЕФ ФПМЛПЧЩИ УТЕДУФЧ ХРТБЧМЕОЙС ЧЕТУЙСНЙ Й ЛПММЕЛФЙЧОПК ТБВПФЩ. рПФПНХ, ЮФП ЬФП ЖПТНБФ ТБЪНЕФЛЙ РЕЮБФЙ, Б ОЕ УНЩУМПЧПК УФТХЛФХТЩ, Й ОЕФ ЧПЪНПЦОПУФЙ ЙИ УППФОПУЙФШ. рПФПНХ, ЮФП РТЙ ЬЛУРПТФЕ РПМХЮБЕФУС УПЧЕТЫЕООП ОЕХДПЧМЕФЧПТЙФЕМШОЩК HTML. рПФПНХ, ЮФП ЛБЮЕУФЧП ЧЕТУФЛЙ Й РЕЮБФЙ ОЙЦЕ УТЕДОЕЗП.

рПЮЕНХ ОЕ T E X? рПФПНХ, ЮФП ЬФП УМЙЫЛПН ОЙЪЛПХТПЧОЕЧЩК СЪЩЛ. еЗП ОЕ ДБЫШ Ч ТХЛЙ ОБЮЙОБАЭЕНХ. рПФПНХ, ЮФП ЬФП ЖПТНБФ ТБЪНЕФЛЙ РЕЮБФЙ, Б ОЕ УНЩУМПЧПК УФТХЛФХТЩ . рПФПНХ, ЮФП НБМП T E X-ПТЙЕОФЙТПЧБООЩИ ТЕДБЛФПТПЧ. рПФПНХ, ЮФП ОЕФ ХДПЧМЕФЧПТЙФЕМШОЩИ УТЕДУФЧ ЬЛУРПТФБ Ч Word.

рПЮЕНХ ОЕ HTML? рПФПНХ, ЮФП УБНП РПОСФЙЕ HTML УЙМШОП ТБЪНЩФП ЗПОЛПК WWW ЪБ ЛПННЕТГЙЕК Й ЧПКОПК РТПЙЪЧПДЙФЕМЕК ВТБХЪЕТПЧ ДТХЗ У ДТХЗПН. рПФПНХ, ЮФП HTML УФТБДБЕФ ЧУЕ ФЕН ЦЕ ОЕДПУФБФЛПН: ПТЙЕОФЙТПЧБО ОБ РТЕДУФБЧМЕОЙЕ, Б ОЕ ОБ УФТХЛФХТХ. рПФПНХ, ЮФП ПО ПЮЕОШ ВЕДЕО ЧЩТБЪЙФЕМШОЩНЙ УТЕДУФЧБНЙ, Й ПФУХФУФЧХАФ ЧПЪНПЦОПУФЙ ЕЗП ТБУЫЙТЕОЙС. рПФПНХ, ЮФП ОЕ ТЕЫЕОБ РТПВМЕНБ ЛПТТЕЛФОПК ТХУЙЖЙЛБГЙЙ. рПФПНХ, ЮФП ОЕФ ХДПЧМЕФЧПТЙФЕМШОЩИ УТЕДУФЧ ЬЛУРПТФБ Ч Word.

SGML РТПФЙЧ WYSIWYG

дМС ФЕИ, ЛФП РТЙЧЩЛ РПМШЪПЧБФШУС ФПМШЛП "word processor"-БНЙ, ОБРТЙНЕТ, MS Word ЙМЙ WordPerfect, НПЦЕФ ВЩФШ ЙОФЕТЕУОП УПРПУФБЧМЕОЙЕ ЙИ У SGML ЙОУФТХНЕОФБНЙ. ьФЙ ДЧЕ ЗТХРРЩ РТПЗТБННОЩИ УТЕДУФЧ, ОЕУНПФТС ОБ УИПЦЕУФШ ТЕЫБЕНЩИ ЪБДБЮ -- РТПЙЪЧПДУФЧП ДПЛХНЕОФПЧ -- ЧЕУШНБ ДТХЗ ПФ ДТХЗБ ПФМЙЮБАФУС РП БТИЙФЕЛФХТЕ Й ЖХОЛГЙСН.

Word processor -- ЬФП ЙОФЕММЕЛФХБМШОБС РЙЫХЭБС НБЫЙОЛБ. пО ПТЙЕОФЙТПЧБО ОБ ТБВПФХ У ЧЙЪХБМШОЩН РТЕДУФБЧМЕОЙЕН ФЕЛУФБ, ИБТБЛФЕТЙЪХАЭЕЗПУС ОБВПТПН УФЙМЕК: УФЙМЕК УЙНЧПМПЧ (ЫТЙЖФ, ЛЕЗМШ, ОБЮЕТФБОЙЕ), БВЪБГЕЧ (ЛТБУОБС УФТПЛБ, ЧЩТБЧОЙЧБОЙЕ, РПМПЦЕОЙЕ РП ЫЙТЙОЕ УФТБОЙГЩ), УФТБОЙГ (ЛПМПОФЙФХМЩ, УОПУЛЙ), ТБЪДЕМПЧ Й ДПЛХНЕОФПЧ (ЖПТНБФ ВХНБЗЙ, ПЗМБЧМЕОЙЕ), Й РТПЮЙИ. Word processor ОЕ ТБВПФБЕФ У ЧОХФТЕООЕК УФТХЛФХТПК ДПЛХНЕОФБ.

SGML ТЕДБЛФПТ, ОБРТПФЙЧ, ПТЙЕОФЙТПЧБО ОБ ТБВПФХ У УПДЕТЦЙНЩН ДПЛХНЕОФБ. дМС SGML ТЕДБЛФПТБ, ОБРТЙНЕТ, ТБЪДЕМ -- ЬФП ЬМЕНЕОФ, Ч ЛПФПТЩК НПЗХФ ЧЛМАЮБФШУС РПДТБЪДЕМЩ, Б ОЕ РТПНЕЦХФПЛ ПФ ПДОПЗП БВЪБГБ, ОБВТБООПЗП УФЙМЕН "ъБЗПМПЧПЛ" ДП ДТХЗПЗП, ЛБЛ ДМС word processor-a.

ьФП РПЪЧПМСЕФ БЧФПТХ УПУТЕДПФПЮЙФШУС ОБ УПДЕТЦБОЙЙ ФЕЛУФБ, Б ОЕ ЧПЪЙФШУС У ЕЗП ЖПТНБФЙТПЧБОЙЕН Й ЧЩВПТПН УФЙМЕК. чЙЪХБМШОБС УФЙМЙУФЙЛБ ДПЛХНЕОФБ ПРТЕДЕМСЕФУС РТЙ ЕЗП ЬЛУРПТФЕ Ч ЧЩИПДОЩЕ ЖПТНБФЩ, Б ОЕ РТЙ ОБВПТЕ ФЕЛУФБ.

п РТПЗТБННОПН ПВЕУРЕЮЕОЙЙ

юФПВЩ ОБЮБФШ ТБВПФБФШ У ДПЛХНЕОФБНЙ Ч SGML РПМШЪПЧБФЕМА ОХЦОЩ ДЧБ ПУОПЧОЩИ УТЕДУФЧБ: ТЕДБЛФПТ Й УТЕДУФЧБ ЬЛУРПТФБ (ЖПТНБФЙТПЧБОЙС).

SGML-ТЕДБЛФПТ

SGML-ТЕДБЛФПТ ПФМЙЮБЕФУС ЛБЛ ПФ РТЙЧЩЮОЩИ ФЕЛУФПЧЩИ ТЕДБЛФПТПЧ, ФБЛ Й ПФ "word processor"-ПЧ. пФ РЕТЧЩИ -- ОБМЙЮЙЕН РПДДЕТЦЛЙ УФТХЛФХТЙТПЧБООЩИ ДПЛХНЕОФПЧ, ПФ ЧФПТЩИ -- ПФУХФУФЧЙЕН РПДДЕТЦЛЙ ЧЙЪХБМШОПЗП ЖПТНБФЙТПЧБОЙС. тЕДБЛФПТ ТБЪВЙТБЕФ DTD ТЕДБЛФЙТХЕНПЗП ДПЛХНЕОФБ Й "ЧЕДЕФ" РПМШЪПЧБФЕМС Ч УППФЧЕФУФЧЙЙ У ОЙН. оБРТЙНЕТ, ЕУМЙ DTD РТЕДХУНБФТЙЧБЕФ ЬМЕНЕОФ

, Ч ЛПФПТПН НПЗХФ ЧУФТЕЮБФШУС ФПМШЛП ЬМЕНЕОФЩ ЙМЙ , ФП РПМШЪПЧБФЕМА, ТЕДБЛФЙТХАЭЕНХ ЬМЕНЕОФ
, ВХДЕФ РТЕДМПЦЕОП ЧУФБЧЙФШ ПДЙО ЙЪ ЬФЙИ ДЧХИ ТБЪТЕЫЕООЩИ ЬМЕНЕОФПЧ. SGML-ТЕДБЛФПТ ФБЛЦЕ ПВЩЮОП УПДЕТЦЙФ УТЕДУФЧБ ОБЧЙЗБГЙЙ РП ЙЕТБТИЙЙ ДПЛХНЕОФ.

йЪ ЮЙУМБ РПРХМСТОЩИ SGML-ТЕДБЛФПТПЧ НПЦОП ОБЪЧБФШ ArborText ADEPT*Editor , SoftQuad Author/Editor , psgml , Adobe FrameMaker+SGML , Corel WordPerfect , Й НОПЦЕУФЧП ДТХЗЙИ.

уТЕДУФЧБ ЖПТНБФЙТПЧБОЙС

уХЭЕУФЧХЕФ НОПЦЕУФЧП УТЕДУФЧ ТБВПФЩ У SGML ФЕЛУФБНЙ. вóМШЫХА ЙИ ЮБУФШ УПУФБЧМСАФ УТЕДУФЧБ ЖПТНБФЙТПЧБОЙС -- ЬЛУРПТФБ SGML Ч ДТХЗЙЕ ЖПТНБФЩ ДМС РЕЮБФЙ, РТПУНПФТБ Й Ф.Р. чЩИПДОЩЕ ЖПТНБФЩ НПЗХФ ВЩФШ МАВЩНЙ, ЪБЧЙУС МЙЫШ ПФ ДПУФХРОПЗП РТПЗТБННОПЗП ПВЕУРЕЮЕОЙС Й ОХЦД РПМШЪПЧБФЕМС. оБРТЙНЕТ, С ЙУРПМШЪХА ЛПОЧЕТФЕТЩ Ч HTML, RTF Й L A T E X.

В 1986 году, задолго до того, как идея создания сети Веб была воплощена в жизнь, универсальный стандартизированный язык разметки SGML (Standardized Generalized Markup Language ) был утвержден в качестве международного стандарта (ISO 8879 ) определения языков разметки, хотя SGML существовал еще с конца шестидесятых. Он использовался для того, чтобы описывать языки разметки, предоставляя при этом автору возможность давать формальные определения каждому элементу и атрибуту языка .

Язык HTML первоначально был всего лишь одним из SGML -приложений. Он описывал правила, по которым должна быть подготовлена информация для World Wide Web . Таким образом, язык HTML - это набор предписаний SGML , сформулированных в виде определения типа документа (DTD ), объясняющих, что именно обозначают тэги и элементы. Схема DTD для языка HTML хранится в веб-браузере.

К недостаткам языка HTML можно отнести следующие:

  • HTML имеет фиксированный набор тэгов . Нельзя создавать свои тэги, понятные другим пользователям.
  • HTML - это исключительно технология представления данных . HTML не несет информации о значении содержания, заключенного в тэгах.
  • HTML - "плоский" язык . Значимость тэгов в нем не определена, поэтому с его помощью нельзя описать иерархию данных.
  • В качестве платформы для приложений используются браузеры . HTML не обладает достаточной мощью для создания веб-приложений на том уровне, к которому в настоящее время стремятся веб-разработчики. Например, на языке HTML невозможно разработать приложение для профессиональной обработки и поиска документов.
  • Большие объемы трафика сети . Существующие HTML -документы, используемые как приложения, перегружают Интернет большими объемами трафика в системах клиент-сервер. Примером может служить пересылка по сети большого по объему документа, в то время как необходима только небольшая часть этого документа.

Таким образом, с одной стороны, язык HTML является очень удобным средством разметки документов для использования в веб, а с другой - документ, размеченный в HTML , имеет мало информации о своем содержании. Если тот или иной документ несет достаточно полную информацию о своем содержании, появляется возможность сравнительно легко провести автоматическую обобщенную обработку и поиск в файле, хранящем документ. Язык SGML позволяет сохранять информацию о содержании документа, однако вследствие особой сложности он никогда не использовался так широко, как HTML .

Группа экспертов по языку SGML , возглавляемая Джоном Боузэком (Jon Bosak ) из компании Sun Microsystems , приступила к работе по созданию подмножества языка SGML , которое могло бы быть принято Web -сообществом. Решено было удалить многие несущественные возможности SGML . Перестроенный таким образом язык назвали XML . Упрощенный вариант оказался значительно более доступным, чем оригинал, его спецификации занимали всего 26 страниц по сравнению с более чем 500 страницами спецификаций SGML .

Рассмотрим более детально структуру и особенности этого языка.

XML ( eXtensible Markup Language ) - рекомендованный W3C язык разметки . XML - текстовый формат , предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе специализированных языков разметки. XML является упрощённым подмножеством языка SGML .

Язык XML имеет следующие достоинства :

  • Это человеко-ориентированный формат документа, он понятен как человеку, так и компьютеру.
  • Поддерживает Юникод.
  • В формате XML могут быть описаны основные структуры данных - такие как записи, списки и деревья.
  • Это самодокументируемый формат, который описывает структуру и имена полей также как и значения полей.
  • Имеет строго определённый синтаксис и требования к анализу, что позволяет ему оставаться простым, эффективным и непротиворечивым.
  • Широко используется для хранения и обработки документов;
  • Это формат, основанный на международных стандартах;
  • Иерархическая структура XML подходит для описания практически любых типов документов;
  • Представляет собой простой текст, свободный от лицензирования и каких-либо ограничений;
  • Не зависит от платформы;
  • Является подмножеством SGML , для которого накоплен большой опыт работы и созданы специализированные приложения;

К известным недостаткам языка можно отнести следующие:

  • Синтаксис XML избыточен.
    • Размер XML документа существенно больше бинарного представления тех же данных (порядка 10 раз).
    • Размер XML документа существенно больше, чем документа в альтернативных текстовых форматах передачи данных (например JSON , YAML ) и особенно в форматах данных, оптимизированных для конкретного случая использования.
    • Избыточность XML может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных.
    • Для большого количества задач не нужна вся мощь синтаксиса XML , и можно использовать значительно более простые и производительные решения.
  • Пространства имён XML сложно использовать и их сложно реализовывать в XML парсерах .
  • XML не содержит встроенной в язык поддержки типов данных. В нём нет понятий "целых чисел", "строк", "дат", "булевых значений" и т. д.
  • Иерархическая модель данных , предлагаемая XML , ограничена по сравнению с реляционной моделью и объектно-ориентированными графами.

Вообще говоря, XML можно рассматривать не только как новый язык разметки , но и как основу для целого семейства технологий:

Таблица 9.1. Структура семейства XML
XML Технические рекомендации об использовании XML
DTD Определение типа документа (схема)
XDR Формат XML Reduced (схема Microsoft )
XSD Определение схемы XML (схемы W3C )
Пространство имен Метод определения имен элементов и атрибутов
XPath Язык путей XML
XLink Язык ссылок XML
XPointer Язык указателей XML
DOM API для объектной модели документа
SAX Простой API для XML
XSL Расширяемый язык таблиц стилей
XSL -FO Объекты форматирования XSL
XSLT Язык преобразований XSL
XInclude Синтаксис XML Include

Языки разметки: SGML, HTML, XML. Их связь между собой.

Язык HTML первоначально был всего лишь одним из SGML-приложений. Он описывал правила, по которым должна быть подготовлена информация для World Wide Web. Таким образом, язык HTML - это набор предписаний SGML, сформулированных в виде определения типа документа (DTD), объясняющих, что именно обозначают тэги и элементы. Схема DTD для языка HTML хранится в веб-браузере.

Таким образом, с одной стороны, язык HTML является очень удобным средством разметки документов для использования в веб, а с другой - документ, размеченный в HTML, имеет мало информации о своем содержании. Если тот или иной документ несет достаточно полную информацию о своем содержании, появляется возможность сравнительно легко провести автоматическую обобщенную обработку и поиск в файле, хранящем документ. Язык SGML позволяет сохранять информацию о содержании документа, однако вследствие особой сложности он никогда не использовался так широко, как HTML.

Группа экспертов по языку SGML, возглавляемая Джоном Боузэком (Jon Bosak) из компании Sun Microsystems, приступила к работе по созданию подмножества языка SGML, которое могло бы быть принято Web-сообществом. Решено было удалить многие несущественные возможности SGML. Перестроенный таким образом язык назвали XML. Упрощенный вариант оказался значительно более доступным, чем оригинал, его спецификации занимали всего 26 страниц по сравнению с более чем 500 страницами спецификаций SGML.

Преимущества языка XML.

  • Поддерживает Юникод.
  • Не зависит от платформы;

Веб-сервисы

Веб-сервис (web service) - программная система, имеющая идентификатор URI, и общедоступные интерфейсы которой определены на языке XML. Описание этой программной системы может быть найдено другими приложениями, которые могут взаимодействовать с ней в соответствии с этим описанием посредством сообщений, основанных на XML, и передаваемых с помощью интернет-протоколов. Веб-служба является единицей модульности при использовании сервис-ориентированной архитектуры приложения.

Сервис-ориентированная архитектура (SOA, service-oriented architecture) - модульный подход к разработке программного обеспечения, основанный на использовании сервисов со стандартизированными интерфейсами.

В основе SOA лежат принципы многократного использования функциональных элементов ИТ, унификации типовых операционных процессов. Компоненты программы могут быть распределены по разным узлам сети, и предлагаются как независимые и слабо связанные, заменяемые сервисы-приложения.

Интерфейс компонентов SОА-программы осуществляет инкапсуляцию деталей реализации конкретного компонента (ОС, языка программирования и т. п).

Веб-сервисы.NET имеют следующие достоинства:

  • Открытость стандартов . В веб-сервисах отсутствуют какие-либо скрытые или недоступные элементы. Каждый аспект технологии, от способа поиска веб-сервисы до ее описания и организации связи с ней, определен общедоступными стандартами.
  • Межплатформенность . Язык программирования, который позволяет создавать XML-документы и отправлять информацию посредством HTTP, позволяет взаимодействовать с любым веб-сервисом. Можно получать веб-услугу из системы, отличной от.NET.
  • Простота .
  • Поддержка сообщений на понятном человеку языке . Переход от двоичных стандартов, применяемых в СОМ и CORBA, к XML-тексту позволил упростить исправление ошибок и обеспечил возможность осуществлять взаимодействие с веб-сервисами по обычным каналам HTTP.

Реализация веб-сервисов.NET осуществляется так же просто, как и активизация удаленной веб-сервисы или вызов метода локального класса. Это достигается за счет применения инструментов, предоставляемых системой.NET Framework, которые позволяют создать полноценный веб-сервис, без необходимости изучения деталей работы таких стандартов, как SOAP, WSDL и UDDI. При этом выполняются следующие действия:

  1. Веб-сервис разрабатывается как.NET-класс с атрибутами, которые идентифицируют его как веб-сервис с некоторыми функциями.
  2. В среде.NET автоматически создается документ WSDL, где описывается, как клиент должен взаимодействовать с веб-сервисом.
  3. Потребитель находит созданный веб-сервис и может добавить соответствующую веб-ссылку в проект Visual Studio .NET.
  4. В среде.NET осуществляется автоматическая проверка документа WSDL и генерируется прокси-класс, который позволяет потребителю взаимодействовать с веб-сервисом.
  5. Потребитель вызывает один из методов вашего класса веб-сервиса. С его точки зрения этот вызов внешне ничем не отличается от вызова метода любого другого класса, хотя взаимодействие происходит на самом деле с прокси-классом, а не с веб-сервисом.
  6. Прокси-класс преобразует, переданные параметры в сообщение SOAP и отправляет его веб-сервису.
  7. Затем прокси-класс получает SOAP-ответ, преобразует его в соответствующий тип данных и возвращает его как обычный тип данных.NET.
  8. Потребитель использует полученные данные.

При работе веб-сервисов.NET используется технология ASP .NET, являющаяся частью системы.NET Framework. Она также требует поддержки со стороны сервера Microsoft IIS.

Главными недостатками веб-сервисов являются меньшая производительность и больший размер сетевого трафика по сравнению с такими технологиями как RMI, CORBA, DCOM за счет использования текстовых XML-сообщений.

Стандарты для Web-сервисов.

Спецификация WSDL

Каждый веб-сервис предоставляет документ WSDL (Web Service Description Language - язык описания веб-сервиса), в котором описывается все, что клиенту необходимо для работы с этим сервисом. WSDL-документ предоставляет простой и последовательный способ задания разработчиком синтаксиса вызова любого веб-метода. Более того, этот документ позволяет использовать инструменты автоматического генерирования прокси-классов, подобные включенным в среды Visual Studio .NET и.NET Framework. Благодаря указанным средствам использование веб-сервиса является таким же простым, как и применение локального класса.

WSDL-документ имеет основанный на XML формат, в соответствии с которым информация подразделяется на пять групп. Первые три группы представляют собой абстрактные определения, не зависящие от особенностей платформы, сети или языка, а оставшиеся две группы включают конкретные описания.

Протокол SOAP

Связь между веб-сервисами и их клиентами осуществляется посредством сообщений в формате XML.

SOAP (Simple Object Access Protocol - простой протокол доступа к объектам) представляет собой протокол сообщений для выбора веб-сервисов.

Основная идея стандарта SOAP заключается в том, что сообщения должны быть закодированы в стандартизированном XML-формате.

Кроме сообщений SOAP, для обмена данными с сервисами.NET можно использовать методы GET и POST протокола HTTP.

Преимущества применения формата SOAP перед другими форматами для передачи данных:

  • Кодировать в XML структуры данных и наборы DataSet с использованием SOAP так же легко, как и данные простых скалярных типов.
  • При использовании SOAP-сообщений предоставляются дополнительные инструменты, позволяющие легко добавлять, например, функции обеспечения безопасности или трассировки.
  • Имеются наборы инструментов SOAP для различных языков программирования (и даже для предыдущих версий Microsoft C++ и Visual Basic). Иначе, для того чтобы обеспечить связь с сервисом посредством методов GET и POST протокола HTTP, придется, очевидно, самостоятельно конструировать строку запроса, а затем проводить синтаксический анализ ответа.

Стандарт DISCO

Стандарт DISCO предоставляет простейший способ получения доступа к файлам манифестов, позволяющий группировать ссылки на веб-сервисы.

DISCO-файл может включать файлы различных веб-серверов и поддерживает "динамический поиск" - автоматический поиск каталога файлов веб-сервисов на сервере.

Файлы манифеста полезны тем, что объединяют множество веб-сервисов в единственном списке, однако они не позволяют клиентам отыскивать веб-сервисы определенного типа без указания наименования компании-разработчика.

Спецификация UDDI

Спецификация UDDI (Universal Description, Discovery, and Integration - универсальное описание, поиск и интеграция) позволяет избежать указанных проблем посредством использования специального хранилища (репозитория), где предприятия и организации могут размещать данные о предоставляемых ими сервисах. Инициаторами создания технологии UDDI стали более 100 компаний (полный список можно найти по адресу http://www.uddi.org/community.html), включая Sun и Microsoft. Объединив свои усилия, эти компании разработали проект спецификации UDDI, которая по истечении 18 месяцев была стандартизирована.

Информация в этом репозитории должна обновляться вручную. С этой целью некоторые "узловые операторы" хранят идентичные копии репозитория UDDI. Эти компании обеспечивают хранение указанного репозитория и бесплатный доступ к нему для популяризации веб-серисов. Кроме того, Майкрософт включила версию UDDI в программное обеспечение сервера Windows .NET для использования в корпоративных сетях интранета.

В хранилище UDDI содержатся сведения о предприятиях, предоставляющих веб-сервисы, о типе каждого сервиса и связях с информацией и спецификациями, относящимися к этим сервисам. Интерфейс UDDI сам по себе представляет собой веб-сервис. Для регистрации или поиска службы следует отправить SOAP-сообщение.

WEB - интеграция.

Задача веб-интеграции заключается в том, чтобы объединить разнородные веб-приложения и системы в единую среду на базе сети Веб.

Практикуются следующие подходы к веб-интеграции:

· Интеграция на уровне представления. Данный уровень позволяет пользователю взаимодействовать с приложением. Интеграция на уровне представления дает доступ к пользовательскому интерфейсу удаленных приложений .

· Интеграция на уровне функциональности. Данная интеграция подразумевает обеспечение прямого доступа к бизнес-логике приложений. Это достигается непосредственным взаимодействием приложений с API (программному интерфейсу приложений) или же взаимодействием посредством веб-сервисов .

· Интеграция на уровне данных. В данном случае предполагается доступ к одной или нескольким базам данных , используемых удаленным приложением.

· Комплексная интеграция. Коммерческие решения по веб-интеграции, как правило, включают все три типа интеграции

Использование веб-интеграции выгодно по многим причинам:

· Веб-интеграция позволяет развертывать информационные системы на базе сторонних приложений без необходимости разбираться в их родительских системах, программных средах и архитектурах баз данных.

· SOA и веб-сервисы используют программный язык и платформо-независимые интерфейсы между приложениями корпоративной инфраструктуры ИТ. Это дает очевидные преимущества в поддержке, управляемости, развертывании информационных сетей.

· Веб-интеграция позволяет конструировать комплексную функциональность, комбинируя разнородные компоненты посредством протоколов веб-сервисов.

· Веб-интеграция позволяет использовать веб-сервисы разработчиков.

· Веб-интеграция позволяет развивать программные интерфейсы приложений через протоколы веб-сервисов без программирования.

Для веб-интеграции обычно используется коммерч ПО или популярные тех-ии, такие как PHP/Python/Perl , XForms , SOAP и т.д.

Интеграция на основе XML

Вместо реализации взаимодействия между каждой парой систем следует всего лишь научить каждую из них "говорить" на XML языке. Иначе говоря, все сводится к разработке нескольких врапперов (wrapper - упаковщик, программное средство создания системной оболочки для стандартизации внешних обращений и изменения функциональной ориентации действующей системы), которые будут переводить со стандартного XML-языка интегрированной системы на язык, понятный каждой системе в отдельности.

· средства разработки и стандартные библиотеки для XML существуют практически на всех платформах и для большинства популярных языков программирования;

· методы работы с XML достаточно стандартны для того, чтобы в разных системах можно было пользоваться одинаковыми приемами;

· информация, оформленная в виде XML, может обрабатываться не только машинами, но и человеком (что намного облегчает отладку).

В принципе, интеграция по XML-схеме не отличается коренным образом от интеграции на основе любого другого общего стандарта. Вместе с тем, она имеет целый ряд весомых преимуществ:

· XML языки не зависят от аппаратных и программных платформ, что позволяет связывать разнородные системы;

· выразительная мощность XML достаточно велика для того, чтобы описать данные практически любой сложности;

Интеграция на основе XML практически реализуется в рамках протоколов:

· XML-RPC . Это протокол удаленного вызова процедур с передачей данных в формате XML через TCP-порт 80, т.е. HTTP -порт.

· WDDX (Web Distributed Exchange). Представляет собой механизм обмена сложными структурами данных по протоколу HTTP. Протокол базируется не на структурах, а на событиях.

· ebXML (electronic buisiness XML) – XML для электронного бизнеса. Основное назначение – предоставление открытой XML-инфраструктуры, обеспечивающей безопасное глобальное использование информации электронного бизнеса. Веб-сервисы (веб-службы).

XML (eXtensibleMarkupLanguage) - рекомендованный W3C язык разметки. XML - текстовый формат, предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе специализированных языков разметки. XML является упрощенным подмножеством языка SGML.

ЯзыкXML имеет следующие достоинства :

  • Это человеко-ориентированный формат документа, он понятен как человеку, так и компьютеру.
  • Поддерживает Юникод.
  • В формате XML могут быть описаны основные структуры данных - такие как записи, списки и деревья.
  • Это самодокументируемый формат, который описывает структуру и имена полей также как и значения полей.
  • Имеет строго определенный синтаксис и требования к анализу, что позволяет ему оставаться простым, эффективным и непротиворечивым.
  • Широко используется для хранения и обработки документов;
  • Это формат, основанный на международных стандартах;
  • Иерархическая структура XML подходит для описания практически любых типов документов;
  • Представляет собой простой текст, свободный от лицензирования и каких-либо ограничений;
  • Не зависит от платформы;
  • Является подмножеством SGML, для которого накоплен большой опыт работы и созданы специализированные приложения;

К известным недостаткам языка можно отнести следующие:

· Синтаксис XML избыточен.

· Размер XML документа существенно больше бинарного представления тех же данных.

· Размер XML документа существенно больше, чем документа в альтернативных текстовых форматах передачи данных (например JSON, YAML) и особенно в форматах данных, оптимизированных для конкретного случая использования.

· Избыточность XML может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных.

· Для большого количества задач не нужна вся мощь синтаксиса XML, и можно использовать значительно более простые и производительные решения.

  • Пространства имен XML сложно использовать и их сложно реализовывать в XML парсерах.
  • XML не содержит встроенной в язык поддержки типов данных. В нем нет понятий "целых чисел", "строк", "дат", "булевых значений" и т. д.
  • Иерархическая модель данных, предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами.

По-сути, XML служит метаязыком для описания структуры других языков. Взаимосвязь между SGML, XML, HTML и некоторыми другими языками показана на следующей диаграмме:

Важным отличием XML от HTML является то большое внимание, которое уделяется контролю за тем, насколько точно соблюдаются правила языка при разметке документов. В зависимости от этого принято выделять правильно построенные и действительные XML документы.

Документ XML считается правильно построенным , если он соответствует всем синтаксическим правилам XML.

Проверка действительности документа предполагает выполнение следующих действий:

  • Проверка использования только заданного набора дескрипторов.
  • Проверка полного соответствия порядка следования элементов и атрибутов содержанию документа или определенным правилам.
  • Контроль типов данных (достигается при использовании соответствующей схемы).
  • Контроль целостности данных для обеспечения оптимального обмена информацией через Веб с помощью транзакций.

Основные синтаксические правила построения XML документов.

  • XML документ содержит один и только один корневой элемент , содержащий все остальные элементы
  • Дочерние элементы , содержащиеся в корневом элементе , должны быть правильно вложены.
  • Имена элементов подчиняются правилам:
  • Имя начинается с буквы, знака подчеркивания или двоеточия.
  • После первого символа в имени могут быть буквы, цифры, знаки переноса, подчеркивания, точка или двоеточие.
  • Имена не могут начинаться с буквосочетания XML.

XML документ имеет следующую структуру:

  • Первая строка XML документа называется объявлением XML. Это необязательная строка, указывающая версию стандарта XML (обычно это 1.0). Также здесь может быть указана кодировка символов и внешние зависимости.

Лучшие статьи по теме