Смотреть что такое "DTD" в других словарях. Введение в XML DTD

Главный писатель по вопросам технологий

Вам кто-то послал по электронной почте файл DTD, и вы не знаете, как его открыть? Может быть, вы нашли файл DTD на вашем компьютере и вас заинтересовало, что это за файл? Windows может сказать вам, что вы не можете открыть его, или, в худшем случае, вы можете столкнуться с соответствующим сообщением об ошибке, связанным с файлом DTD.

До того, как вы сможете открыть файл DTD, вам необходимо выяснить, к какому виду файла относится расширения файла DTD.

Tip: Incorrect DTD file association errors can be a symptom of other underlying issues within your Windows operating system. These invalid entries can also produce associated symptoms such as slow Windows startups, computer freezes, and other PC performance issues. Therefore, it highly recommended that you scan your Windows registry for invalid file associations and other issues related to a fragmented registry.

Ответ:

Файлы DTD имеют Файлы данных, который преимущественно ассоциирован с DesignTools 2D Design (TechSoft UK Limited).

Файлы DTD также ассоциированы с ArcView UNIX Hyperhelp Supporting File (ESRI), SGML Document Definition File и FileViewPro.

Иные типы файлов также могут использовать расширение файла DTD. Если вам известны любые другие форматы файлов, использующие расширение файла DTD, пожалуйста, свяжитесь с нами , чтобы мы смогли соответствующим образом обновить нашу информацию.

Как открыть ваш файл DTD:

Самый быстрый и легкий способ открыть свой файл DTD - это два раза щелкнуть по нему мышью. В данном случае система Windows сама выберет необходимую программу для открытия вашего файла DTD.

В случае, если ваш файл DTD не открывается, весьма вероятно, что на вашем ПК не установлена необходимая прикладная программа для просмотра или редактирования файлов с расширениями DTD.

Если ваш ПК открывает файл DTD, но в неверной программе, вам потребуется изменить настройки ассоциации файлов в вашем реестре Windows. Другими словами, Windows ассоциирует расширения файлов DTD с неверной программой.

Установить необязательные продукты - FileViewPro (Solvusoft) | | | |

DTD Multipurpose Internet Mail Extensions (MIME):

  • mime text/xml

DTD Инструмент анализа файлов™

Вы не уверены, какой тип у файла DTD? Хотите получить точную информацию о файле, его создателе и как его можно открыть?

Теперь можно мгновенно получить всю необходимую информацию о файле DTD!

Революционный DTD Инструмент анализа файлов™ сканирует, анализирует и сообщает подробную информацию о файле DTD. Наш алгоритм (ожидается выдача патента) быстро проанализирует файл и через несколько секунд предоставит подробную информацию в наглядном и легко читаемом формате.†

Уже через несколько секунд вы точно узнаете тип вашего файла DTD, приложение, сопоставленное с файлом, имя создавшего файл пользователя, статус защиты файла и другую полезную информацию.

Чтобы начать бесплатный анализ файла, просто перетащите ваш файл DTD внутрь пунктирной линии ниже или нажмите «Просмотреть мой компьютер» и выберите файл. Отчет об анализе файла DTD будет показан внизу, прямо в окне браузера.

Перетащите файл DTD сюда для начала анализа

Просмотреть мой компьютер »

Пожалуйста, также проверьте мой файл на вирусы

Ваш файл анализируется... пожалуйста подождите.

Используйте для определения структуры XML-документов XML-схемы вместо DTD

XML-схема обладает более мощными возможностями, чем DTD. Для иллюстрации преимуществ использования механизма XML-схем в первых трех листингах сравниваются различные способы представления элементов. В представлена выдержка из XML-документа. В показаны два элемента, объявленные в синтаксисе DTD, а в представлен синтаксис, соответствующий XML-схеме. Обратите внимание, что синтаксис в Листинге 3 подобен синтаксису XML. При использовании схемы, валидирующий парсер может выполнить проверку, является ли элемент InvoiceNo положительным целым числом, и состоит ли ProductID из заданного набора символов (шести цифр и одной буквы от A до Z). Парсер, обрабатывающий DTD-определение, может лишь подтвердить, что данные элементы представляют собой строки.

Листинг 1: Фрагмент XML-документа
123456789 J123456
Листинг 2: Фрагмент DTD, описывающий элементы из Листинга 1
Листинг 3: Фрагмент XML-схемы, описывающий элементы из Листинга 1

Использование пространств имен в XML-схеме

Ограничения DTD

Несмотря на то, что DTD служат разработчикам SGML и HTML в качестве механизма описания структурированной информации вот уже на протяжении 20-ти лет, DTD обладают некоторыми ограничениями по сравнению с XML-схемами.

Согласно DTD элемент может быть представлен одним из трех способов:

  • Текстовая строка
  • Текстовая строка, смешанная с другим дочерним элементом
  • Набор дочерних элементов

DTD не обладает синтаксисом XML и предлагает лишь ограниченную поддержку для типов и пространств имен.

При совместной работе одна сторона может обрабатывать документы других сторон, и разные стороны могут представлять свои элементы данных по-разному. Более того, в отдельном документе им может потребоваться независимо друг от друга ссылаться на элементы с одинаковым именем, созданные разными сторонами. Использование XML-схемы позволяет различать определения с одним и тем же именем при помощи определения разных пространств имен.

Такая XML-схема определяет набор новых имен, таких как имена элементов, типов, атрибутов, групп атрибутов, чьи определения и объявления описаны в схеме. В имена определяются как InvoiceNo , ProductID и ProductCode .

Имена, определенные в схеме принадлежат так называемому целевому пространству имен . Само по себе пространство имен является фиксированным, произвольным именем, которое должно соответствовать синтаксису URL. К примеру, пространство имен для схемы, представленной в , можно задать следующим образом: http://www.SampleStore.com/Account .

Синтаксис объявления пространства имен иногда может сбить с толку. Объявление начинается с http:// , однако оно не ссылается на файл с описанием схемы. На самом деле, ссылка http://www.SampleStore.com/Account вообще не ведет ни на один файл, а только на назначенное имя.

Определения и объявления в схеме могут ссылаться на имена, которые могут принадлежать другим пространствам имен. В данной статье мы ссылаемся на такие пространства имен как на исходные пространства имен . В каждой схеме может быть определено одно целевое пространство имен и возможно множество исходных пространств имен. Вообще, каждое имя в заданной схеме принадлежит некоему пространству имен. Имена пространства имен могут быть довольно длинными, однако их можно сократить при помощи синтаксиса объявления xmlns в документе XML-схемы. Все эти концепции проиллюстрированы в .

Листинг 4: Целевое и исходное пространства имен

В XML-схеме, представленной с , пространством имен targetNamespace является http://www.SampleStore.com/Account , оно содержит имена InvoiceNo , ProductID и ProductCode . Имена schema , element , simpleType , pattern , string и positive-integer принадлежат исходному пространству имен http://www.w3.org/1999/XMLSchema , которое сокращается как xsd путем объявления xmlns . В псевдониме xsd нет ничего особенного, можно выбрать и другое имя. Для удобства и простоты в оставшейся части статьи мы будем использовать префикс xsd для ссылки на пространство имен http://www.w3.org/1999/XMLSchema , пропуская уточнение xsd в некоторых частях кода. В нашем примере targetNamespace является также одним из исходных пространств имен, так как имя ProductCode используется в определении других имен.

Рисунок 1: Пространства имен для Листинга 4
Листинг 5: Множество исходных пространств имен, импорт пространства имен

Определение элементов

Определением элемента заключается в определении его имени и модели контента. В XML-схеме модель контента элемента определяется его типом. Следовательно, элементы в XML-документе могут иметь только значения, которые подходят типам, определенным в его схеме.

Простые типы

Спецификация XML-схемы определяет несколько простых типов для значений, как показано в Таблице 2 -предопределенные простые типы значений.

Тип элемента может быть простым или комплексным (сложным). Элемент простого типа не может содержать другие элементы или атрибуты. Комплексный тип может создавать эффект встраивания элементов в другие элементы или может ассоциировать атрибуты с элементом. До этого момента мы использовали только примеры с простыми типами, определенными пользователем (см. ProductCode). В спецификацию XML-схемы также включены предопределенные простые типы (см. вставку ). Предопределенный простой тип ограничивает значения по их базовому типу. К примеру, значением предопределенного простого типа ProductCode является подмножество значений базового типа string .

Простые, не вложенные элементы имеют простой тип

Элемент, который не содержит атрибутов или других элементов может быть отнесен к простому типу, предопределенному или определенному пользователем, такому как string , integer , decimal , time , ProductCode и т.п.

Листинг 7: Некоторые простые типы элементов

Элементы с атрибутами должны иметь комплексный тип

Теперь попробуем добавить к простому элементу price из атрибут currency . Вы не сможете этого сделать, так как элемент простого типа не может иметь атрибутов. Если вы хотите добавить атрибут, вам необходимо определить price как элемент комплексного типа. В примере из , мы определяем, так называемый анонимный тип , в котором комплексному типу не дается явного имени. Другими словами, атрибут name элемента complexType не определен.

Листинг 8: Элемент комплексного типа

Элементы, содержащие вложенные элементы должны иметь комплексный тип

В XML-документе в элемент могут быть вложены другие элементы. Это требование выражается напрямую в DTD. XML-схема вместо этого определяет элемент и его тип, который может включать объявления других элементов и атрибутов. Пример приведен в .

Таблица 1: Сравнение комплексных типов данных в DTD и XML-схеме

XML-документ
Cool XML<Title> <Author>Cool Guy</Author> </Book> </span><h5>DTD</h5><span> <!ELEMENT Book (Title, Author)> <!ELEMENT Title (#PCDATA)> <!ELEMENT Author (#PCDATA)> </span><h5>XML-схема</h5><span> <element name="Book" type="BookType"/> <complexType name="BookType"> <element name="Title" type="string"/> <element name="Author" type="string"/> </complexType> </span><h5>Листинг 10: Скрытие BookType как локального типа</h5><span> <element name="Title" type="string"/> <element name="Author" type="string"/> <element name="Book"> <complexType> <element ref="Title"/> <element ref="Author"/> </complexType> </element> </span><h2>Выражение сложных ограничений для элементов</h2><p>XML-схема предлагает большую гибкость, чем DTD при выражении ограничений для модели контента элементов. На простейшем уровне, таком как в DTD, вы можете ассоциировать с элементом атрибуты, а также указать, что в нем может появляться последовательность из только одного (1), нуля или более (*), или одного или более (+) элементов из заданного набора элементов. В XML-схеме можно выразить дополнительные ограничения, используя для этой цели, к примеру, атрибуты minOccurs и maxOccurs для элемента element и элементы choice , group и all .</p><h5>Листинг 11: Выражение ограничений для типов элементов</h5><span> <element name="Title" type="string"/> <element name="Author" type="string"/> <element name="Book"> <complexType> <element ref="Title"/> <element ref="Author"/> </complexType> </element> </span><p>В тег Title является опциональным по отношению к тегу Book (такое же правило можно задать и в DTD). Однако здесь также говорится, что в элементе Book должен быть хотя бы один и не более двух элементов Author . Значением атрибутов minOccurs и maxOccurs тега element по умолчанию является 1. Элемент choice указывает на то, что может появиться только один из указанных дочерних элементов. Другой элемент all определяет, что все дочерние элементы могут появляться только один раз, вместе и в любом порядке, или не появляться совсем. В объявляется, что оба тега Title и Author должны появляться в Book в любом порядке, или не появляться вообще. Подобные ограничения сложно выразить при помощи DTD.</p><h5>Листинг 12: Указатель того, что у элемента должны быть определены все типы</h5><span> <xsd:element name="Title" type="string"/> <xsd:element name="Author" type="string"/> <xsd:element name="Book"> <xsd:complexType> <xsd:all> <xsd:element ref="Tile"/> <xsd:element ref="Author"/> </xsd:all> </xsd:complexType> </xsd:element> </span><h2>Подведение итогов</h2><p>В данном документе мы раскрыли при помощи простых примеров наиболее фундаментальные концепции, необходимые для определения структуры элементов при помощи XML-схемы. Доступно также множество других мощных механизмов:</p><ul><li>XML-схема содержит всестороннюю поддержку для наследования типов, позволяя повторно использовать определенные ранее структуры. Такое использование называют <i>аспектами </i>. Вы можете вывести новые типы, представляющие меньшее подмножество значений других типов, к примеру, для определения подмножества по перечислению, диапазону или по совпадению с шаблоном. В одном из примеров данной статьи тип ProductCode был определен с использованием аспекта pattern . В подтипе также можно добавить для базового типа новые элементы и атрибуты.</li><li>Несколько механизмов, позволяющих контролировать общее определение подтипа или заменять его в определенном документе. К примеру, можно указать, что тип InvoiceType (тип номера инвойса) не может содержать подтипы, то есть никто не сможет определить новую версию InvoiceType . Можно также задать, что в отдельном контексте для типа ProductCode не может быть замещения подтипов.</li><li>Кроме использования подтипов, можно определять эквивалентные типы, то есть значение одного типа может быть замещено значением другого.</li><li>XML-схема обеспечивает механизм для замещения элемента или типа путем объявления их как абстрактных.</li><li>Для большего удобства можно обозначить и задать имена группам атрибутов или элементов. Это позволяет повторно использовать их при последующих обращениях.</li><li>XML-схема предоставляет три элемента – appInfo , documentation и annotation – для использования комментариев, как людьми (documentation) так и приложениями (appInfo)</li><li>Вы можете выразить уникальные ограничения, основывающиеся на определенных атрибутах дочерних элементов.</li> </ul><p>Дополнительную информацию по XML-схемам можно получить из документаций на сайтах W3C (См. ) и dW XML zone. Теперь, когда спецификация XML-схемы получила подтверждение в качестве кандидата на рекомендацию W3C, вы без сомнения можете использовать ее в полной мере.</p> <p><b>20. Языки описания cхем XML </b></p><p><i><b>DTD схемы. Недостатки DTD схем. XDR схемы. Элементы и атрибуты XDR схем. </b> </i></p><p>Идея создания собственных тэгов, имеющих специальное значение и помогающих описать содержание документа, сама по себе просто замечательна. Но если каждый пользователь может создавать свои собственные описания, каким образом их распознавать? С этой целью в спецификации XML для описания подобных "самодеятельных" тэгов используются схемы. Они необходимы для того, чтобы:</p><ul><p>описать, что именно является разметкой;</p><p>описать точно, что означает разметка.</p> </ul><p>Наиболее известными языками описания схем являются следующие:</p><ul><p>DTD (Document Type Definition) - язык определения типа документов, который первоначально использовался в качестве язык описания структуры SGML-документа.</p><p>XDR (XML Data Reduced) – диалект схемы XML, разработанный Microsoft, который поддерживался в Internet Explorer 4 и 5 версий.</p><p>XML Schema или просто XSD (язык определения схем XML) – рекомендация консорциума W3C с 2001 года.</p> </ul><p>Рассмотрим подробнее первые два из них. Третий язык описания схем рассматривается в лабораторной работе 11.</p><p><b>DTD схема </b></p><p>Схема DTD предоставляет шаблон разметки документа, в котором указываются наличие, порядок следования и расположение элементов и их атрибутов в документе XML.</p><p>В рамках DTD модель содержимого XML документа можно описать следующим образом:</p><p>Каждый элемент документа может иметь один из типов:</p><table width="630" cellpadding="2" cellspacing="0"><tr><td width="117" bgcolor="#d8d8d8"> </td><td width="239" bgcolor="#d8d8d8"> <p><b>Синтаксис </b></p> </td><td width="261" bgcolor="#d8d8d8"> <p><b>Комментарий </b></p> </td> </tr><tr valign="top"><td width="117" bgcolor="#eaeaea"> </td><td width="239" bgcolor="#eaeaea"> <p><!ELEMENT имя (#PCDATA)></p> </td><td width="261" bgcolor="#eaeaea"> <p>Содержит только текстовые данные</p> </td> </tr><tr valign="top"><td width="117" bgcolor="#eaeaea"> <p>Другие элементы</p> </td><td width="239" bgcolor="#eaeaea"> <p><!ELEMENT имя (дочерний элемент 1, дочерний элемент 2)></p> </td><td width="261" bgcolor="#eaeaea"> <p>Содержит только дочерние элементы</p> </td> </tr><tr valign="top"><td width="117" bgcolor="#eaeaea"> <p>Смешанное</p> </td><td width="239" bgcolor="#eaeaea"> <p><!ELEMENT имя (#PCDATA, дочерний элемент)*></p> </td><td width="261" bgcolor="#eaeaea"> <p>Содержит комбинацию текстовых данных и дочерних элементов</p> </td> </tr><tr valign="top"><td width="117" bgcolor="#eaeaea"> </td><td width="239" bgcolor="#eaeaea"> <p><!ELEMENT имя EMPTY></p> </td><td width="261" bgcolor="#eaeaea"> <p>Ничего не содержит</p> </td> </tr><tr valign="top"><td width="117" bgcolor="#eaeaea"> </td><td width="239" bgcolor="#eaeaea"> <p><!ELEMENT имя ANY></p> </td><td width="261" bgcolor="#eaeaea"> </td> </tr></table><p>Атрибуты, находящиеся внутри тэгов документа, описываются отдельно с помощью синтаксиса:</p><p>имя_элемента имя_атрибута1 (тип) значение_по_умолчанию</p><p>…………………………………………………………………………………...</p><p>имя_элемента имя_атрибутаN (тип) значение_по_умолчанию ></p><p>При этом атрибут в DTD может иметь один из трех типов:</p><ul><li><p>Маркированные атрибут</p><p>Атрибута с перечислением</p> </ul><p>Кроме типа атрибута можно также задавать и его модальность:</p><p>Рассмотрим в качестве примера описание атрибутов строкового типа для элемента, описывающего некоторое сообщение:</p><p><!ATTLIST message</p><p>number CDATA #REQUIRED</p><p>date CDATA #REQUIRED</p><p>from CDATA #FIXED</p><p>status CDATA #IMPLIED></p><p>Если этот элемент содержит атрибуты с перечислением, то их описание может выглядеть, например, следующим образом:</p><p><!ATTLIST message</p><p>number ID #REQUIRED</p><p>from CDATA #REQUIRED</p><p>alert (low | normal | urgent) "normal"></p><p>Маркированных атрибуты элемента могут быть четырех типов:</p><p>И, наконец, в DTD можно использовать следующие индикаторы вхождения последовательностей:</p><table width="630" cellpadding="2" cellspacing="0"><tr><td width="72" bgcolor="#d8d8d8"> <p><b>Символ </b></p> </td><td width="98" bgcolor="#d8d8d8"> <p><b>Пример </b></p> </td><td width="447" bgcolor="#d8d8d8"> <p><b>Описание </b></p> </td> </tr><tr valign="top"><td width="72" bgcolor="#eaeaea"> </td><td width="98" bgcolor="#eaeaea"> </td><td width="447" bgcolor="#eaeaea"> <p>Последовательное использование элементов списка</p> </td> </tr><tr valign="top"><td width="72" bgcolor="#eaeaea"> </td><td width="98" bgcolor="#eaeaea"> </td><td width="447" bgcolor="#eaeaea"> <p>Используется один из членов списка</p> </td> </tr><tr valign="top"><td width="72" bgcolor="#eaeaea"> </td><td width="98" bgcolor="#eaeaea"> </td><td width="447" bgcolor="#eaeaea"> <p>Используется один и только один элемент</p> </td> </tr><tr valign="top"><td width="72" bgcolor="#eaeaea"> </td><td width="98" bgcolor="#eaeaea"> </td><td width="447" bgcolor="#eaeaea"> <p>Необязательное использование (0 или 1 раз)</p> </td> </tr><tr valign="top"><td width="72" bgcolor="#eaeaea"> </td><td width="98" bgcolor="#eaeaea"> </td><td width="447" bgcolor="#eaeaea"> <p>Используется один или несколько раз</p> </td> </tr><tr valign="top"><td width="72" bgcolor="#eaeaea"> </td><td width="98" bgcolor="#eaeaea"> </td><td width="447" bgcolor="#eaeaea"> <p>Используется ноль или несколько раз</p> </td> </tr></table><p>В качестве примера приведем DTD схему, описывающую структуру электронного почтового ящика:</p><p><!ELEMENT mailbox (message*)></p><p><!ELEMENT message (head, body)></p><p><!ATTLIST message uid CDATA #REQUIRED></p><p><!ELEMENT head (from,to+, subject?, CC*, notify?) ></p><p><!ELEMENT from (#PCDATA)></p><p><!ELEMENT to (#PCDATA)></p><p><!ELEMENT subject (#PCDATA)></p><p><!ELEMENT CC (#PCDATA)></p><p><!ELEMENT notify EMPTY></p><p><!ELEMENT body (#PCDATA)></p><p>Исходный XML документ, удовлетворяющий данной схеме, может выглядеть, например, так:</p><p><?xml version="1.0" ?></p><p><!DOCTYPE mailbox SYSTEM "mailbox.dtd"></p><p><message uid="1"></p><p><from>user1@myhp.edu</from></p><p><to>user2@myhp.edu</to></p><p><subject>Re:</subject></p><p><message uid="2"></p><p><from>user3@myhp.edu</from></p><p><to>user2@myhp.edu</to></p><p><subject>Remind</subject></p><p><CC> user1@myhp.edu </CC></p><p>Remind me about meeting.</p><p>Обратите внимание на 2-ю строчку документа, в которой указывается внешняя ссылка на файл, содержащий DTD схему.</p><p>В принципе, DTD допускает два способа использования в XML документе.</p><p>Объявление внутренней схемы:</p><p><!DOCTYPE корневой_элемент [</p><p><!ELEMENT корневой_элемент (модель содержания)></p><p>Объявление внешней схемы:</p><p><!DOCTYPE корневой_элемент SYSTEM "name.DTD"></p><p>В заключение укажем на следующие недостатки DTD схем:</p><ul><p>Не являются экземплярами XML. Требуется изучение совершенно другого языка.</p><p>Не предоставляют контроль за типами данных, за исключением самых простых текстовых данных.</p><p>Не являются экземплярами XML, поэтому их нельзя легко расширить или преобразовать к другим языкам разметки – HTML или DHTML.</p><p>Не обеспечивают поддержки пространств имен XML.</p> </ul><p><b>XDR схема </b></p><p>XML-Data – полное имя языка описания схем, предложенного Майкрософт, а XML-DataReduced– это "часть" полной рекомендации. Схема XDR - это экземпляр XML, т.е. соответствует всем синтаксическим правилам и стандартам XML.</p><p>Реализуя проверки данных на уровне документа с помощью схемы, приложения, генерирующие и принимающие транзакции, можно оптимизировать для обеспечения максимального быстродействия. Соответствие полей и правильность записей проверяются на уровне экземпляров XML.</p><p>Корневым элементом в схеме XDR всегда является элемент Schema:</p><p>name="имя_схемы" xmlns="urn:schemas-microsoft-com:xml-data"</p><p>xmlns:dt="urn:schemas-microsoft-com:datatypes"></p><p><-- Объявления других элементов --></p><p>Элемент ElementType имеет синтаксис:</p><p>content="{empty | texOnly | eltOnly | mixed}"></p><p>dt:type "datatype"</p><p>model="{open | closed}"</p><p>order="{one | seq | many}"</p><p>Элемент ElementType может иметь следующие атрибуты:</p><table width="630" cellpadding="2" cellspacing="0"><tr valign="top"><td width="89" bgcolor="#eaeaea"> <p><b>Имя атрибута </b></p> </td><td width="533" bgcolor="#eaeaea"> <p><b>Описание </b></p> </td> </tr><tr valign="top"><td width="89" bgcolor="#eaeaea"> </td><td width="533" bgcolor="#eaeaea"> <p>Имя элемента</p> </td> </tr><tr valign="top"><td width="89" bgcolor="#eaeaea"> </td><td width="533" bgcolor="#eaeaea"> </td> </tr><tr valign="top"><td width="89" bgcolor="#eaeaea"> </td><td width="533" bgcolor="#eaeaea"> <p>Тип данных элемента</p> </td> </tr><tr valign="top"><td rowspan="3" width="89" bgcolor="#eaeaea"> </td><td width="533" bgcolor="#eaeaea"> <p>Может принимать значения:</p> </td> </tr><tr><td width="533" valign="top" bgcolor="#eaeaea"> <p>Open – разрешено <u>использовать </u> элементы, не определенные в схеме</p> </td> </tr><tr><td width="533" valign="top" bgcolor="#eaeaea"> <p>Closed – запрещено использовать элементы, не определенные в схеме</p> </td> </tr><tr valign="top"><td rowspan="4" width="89" bgcolor="#eaeaea"> </td><td width="533" bgcolor="#eaeaea"> <p>Порядок следования дочерних элементов в экземпляре XML. Допустимые значения:</p> </td> </tr><tr><td width="533" valign="top" bgcolor="#eaeaea"> <p>one – предполагается наличие одного документа</p> </td> </tr><tr><td width="533" valign="top" bgcolor="#eaeaea"> <p>many – любое количество элементов в любом порядке</p> </td> </tr><tr><td width="533" valign="top" bgcolor="#eaeaea"> <p>seq – элементы указываются в строго заданном порядке.</p> </td> </tr></table><p>качестве дочерних элементов для ElementType можно использовать следующие:</p><table width="630" cellpadding="2" cellspacing="0"><tr valign="top"><td width="133" bgcolor="#eaeaea"> <p><b>Имя элемента </b></p> </td><td width="488" bgcolor="#eaeaea"> <p><b>Описание </b></p> </td> </tr><tr valign="top"><td width="133" bgcolor="#eaeaea"> </td><td width="488" bgcolor="#eaeaea"> <p>Объявляет дочерний элемент</p> </td> </tr><tr valign="top"><td width="133" bgcolor="#eaeaea"> </td><td width="488" bgcolor="#eaeaea"> <p>Обеспечивает описание элемента ElementType</p> </td> </tr><tr valign="top"><td width="133" bgcolor="#eaeaea"> </td><td width="488" bgcolor="#eaeaea"> <p>Обеспечивает тип данных элемента ElementType</p> </td> </tr><tr valign="top"><td width="133" bgcolor="#eaeaea"> </td><td width="488" bgcolor="#eaeaea"> <p>Определяет порядок следования элементов</p> </td> </tr><tr valign="top"><td width="133" bgcolor="#eaeaea"> </td><td width="488" bgcolor="#eaeaea"> <p>Определяет атрибут</p> </td> </tr><tr valign="top"><td width="133" bgcolor="#eaeaea"> </td><td width="488" bgcolor="#eaeaea"> <p>Определяет сведения о дочернем элементе AttributeType</p> </td> </tr></table><p>Для объявления атрибутов используется синтаксис:</p><p><AttributeType</p><p>default="default-value"</p><p>dt:type="primitive-type"</p><p>dt:values="enumerated-values"</p><p>required="{yes|no}"</p><p>В свою очередь элемент AttributeType может иметь атрибуты:</p><table width="630" cellpadding="2" cellspacing="0"><tr valign="top"><td width="83" bgcolor="#eaeaea"> <p><b>Значение </b></p> </td><td width="539" bgcolor="#eaeaea"> <p><b>Описание </b></p> </td> </tr><tr valign="top"><td width="83" bgcolor="#eaeaea"> </td><td width="539" bgcolor="#eaeaea"> <p>Значение по умолчанию</p> </td> </tr><tr valign="top"><td rowspan="2" width="83" bgcolor="#eaeaea"> </td><td width="539" bgcolor="#eaeaea"> <p>Один из следующих типов:</p> </td> </tr><tr><td width="539" valign="top" bgcolor="#eaeaea"> <p>entity, entities, enumeration, id, idref, nmtoken, nmtokens, notation, string</p> </td> </tr><tr valign="top"><td width="83" bgcolor="#eaeaea"> </td><td width="539" bgcolor="#eaeaea"> <p>Допустимые значения</p> </td> </tr><tr valign="top"><td width="83" bgcolor="#eaeaea"> </td><td width="539" bgcolor="#eaeaea"> <p>Имя атрибута</p> </td> </tr><tr valign="top"><td width="83" bgcolor="#eaeaea"> </td><td width="539" bgcolor="#eaeaea"> <p>Указывает на обязательное наличие атрибута в описании</p> </td> </tr></table><p>Синтаксис для описания элемента attribute выглядит следующим образом:</p><p>default="default-value"</p><p>type="attribute-type"</p><p>а его возможные значения могут быть такими:</p><table width="630" cellpadding="2" cellspacing="0"><tr valign="top"><td width="83" bgcolor="#eaeaea"> <p><b>Значение </b></p> </td><td width="539" bgcolor="#eaeaea"></td></tr></table> <p>Это очередная статья в цикле «Основы XML» и в ней мы рассмотрим основы описания структуры XML данных при помощи DTD. Это довольно таки старый способ описания структуры XML-документов, но он до сих пор используется, поэтому мы его все же рассмотрим.</p> <p>Также хочу отметить, что это отличный способ показать, как в XML идет проверка содержимого документа, его грамматики и т.д. Более новый и совершенный способ описания структуры XML-документов с использованием технологии XML Schema мы рассмотрим в следующей статье, ну а пока перейдем непосредственно к изучению DTD XML.</p> <p>В рамках данной статьи мы рассмотрим сразу несколько важных моментов. Это что такое XML DTD и для чего он нужен, поговорим о недостатках DTD, а также научимся самостоятельно составлять собственный DTD для валидации XML-документов. Все это, как обычно, будет изложено пошагово, максимально кратко и понятно с целью экономии вашего времени.</p> <p>Итак, начнем.</p> <h2>Что такое DTD в XML и для чего он нужен</h2> <p>Если говорить кратко, то DTD в XML используется для проверки грамматики документа и соответствия его стандарту (тому, который придумал разработчик или вы сами). Это позволяет парсеру (обработчику) на этапе обработки определить, соответствует ли документ нашим требованиям. То есть, проходит валидация XML-документа.</p> <p>Необходимость проверки грамматики XML-документов заключается в следующем:</p> <ul><li>XML-документ может быть предназначен не для вашей системы.</li> <li>XML-документ может содержать неправильные данные.</li> <li>XML-документ может содержать ошибки в структуре ().</li> </ul><p>Итак, мы разобрались с тем, что такое XML DTD и зачем он нужен. Теперь давайте кратко рассмотрим недостатки DTD, после чего перейдем непосредственно к рассмотрению процесса создания DTD файлов для валидации XML-документов.</p> <h3>Недостатки XML DTD</h3> <ul><li>Отличный от XML синтаксис языка. Это вызывает множество проблем, таких как, например, проблемы с кодировкой или невозможность отслеживать ошибки.</li> <li>Нет проверки типов данных. В DTD есть только один тип – строка.</li> <li>В DTD нет . Нельзя поставить в соответствие документу два и более DTD описаний.</li> </ul><p>Это был краткий список недостатков DTD, которые с успехом исправлены в XML схемах, о которых мы поговорим в следующих статьях.</p> <h4>Объявление элементов, атрибутов и сущностей в DTD. Модификаторы «*», «?», «+»</h4> <p>Для объявления элементов, атрибутов и сущностей в DTD используются специальные декларации и модификаторы. Чтобы подробно во всем разобраться, давайте для начала рассмотрим теоритическую информацию, а затем во второй части статьи перейдем к практическим примерам.</p> <p><b>Определение элемента XML и последовательности элементов XML </b></p> <p> <!ELEMENT название элемента (что может содержать)></p> <p> <!ELEMENT book (title, author, price, description)></p> <p>Элемент book содержит по одному элементу title, author, price и description.</p> <p><b>Альтернативы элементов </b></p> <p> <!ELEMENT название элемента (элемент 1, элемент 2, (элемент 3 | элемент 4 | элемент 5))></p> <p> <!ELEMENT pricelist (title, price, (author | company | sample))></p> <p>Элемент pricelist содержит элементы title, price и один элемент из трех на выбор – author, company либо sample.</p> <p><b>Пустые элементы </b></p> <p> <!ELEMENT элемент EMPTY></p> <p> <!ELEMENT none EMPTY></p> <p>Элемент none должен быть пустым.</p> <p><b>Объявление атрибута </b></p> <p> <!ATTLIST элемент атрибут 1 CDATA #REQUIRED атрибут 2 CDATA #IMPLIED ></p> <p> <!ATTLIST pricelist id CDATA #REQUIRED name CDATA #IMPLIED ></p> <p>Элемент pricelist может содержать два атрибута – атрибут id и атрибут name. При этом атрибут id является обязательным, так как указано #REQUIRED, а атрибут name – не обязательным (указано #IMPLIED). В свою очередь CDATA указывает обработчику, что разбирать содержимое атрибутов не нужно.</p> <p><b>Определение сущностей </b></p> <p> <!ENTITY сущность "что подставлять"></p> <p> <!ENTITY myname "Дмитрий Денисов"></p> <p>Если встретится сущность «&myname;», то вместо нее автоматически подставится «Дмитрий Денисов».</p> <p><b>Модификаторы (объясняют повторения элементов) </b></p> <p>* — ноль или много.<br> ? – ноль или один.<br> + — один или много.</p> <p> <!ELEMENT books (book+)></p> <p>Элемент books может содержать один или более элементов book.</p> <p>Теперь давайте рассмотрим, как это все выглядит на более практических примерах.</p> <h5>Создание DTD-файла для валидации XML-документа на примере прайс-листа книг</h5> <p>Пусть у нас будет все тот же прайс-лист книг, который мы используем для примеров практически в каждой статье про XML. Сам XML-документ будет выглядеть примерно следующим образом.</p> <p> <?xml version="1.0" encoding="utf-8"?> <pricelist> <book> <title>Книга 1 &myname; Цена 1 Описание

Конечно, вышеприведенный пример не является пределом мечтаний, но для примера вполне сойдет. Как видно с примера, у нас есть корневой элемент pricelist, который содержит вложенные элементы book. Внутри элементов book находятся элементы title, author, price и возможно description, которые могут содержать какие-то текстовые данные.

Для валидации данного прайс-листа мы можем использовать DTD-документ следующего содержания.

Теперь разберем все более подробно.

  • — декларируем корневой элемент books и в скобках указываем, что он может содержать. В данном случае он может содержать один или более элементов book (плюсик означает один или более, см. выше).
  • — определяем элемент book. Элемент book может содержать один элемент title, один или более элементов author (плюсик), один элемент price и один или ни одного элемента description (знак вопроса).
  • — определяем элемент title. В качестве содержимого элемента указываем #PCDATA. Это означает, что анализатор обязан разбирать то, что находится внутри этого элемента.
  • Аналогичным образом определяем элементы author, price, description.
  • — определяем сущность. Сначала пишем саму сущность, а затем в кавычках то, что будет выводиться на ее месте. По умолчанию в XML определено только 3 сущности. Это больше («>» — <), меньше («<» — >) и амперсанд («&» — &). При желании вы можете создать неограниченное количество сущностей, используя данный способ. В качестве значений могут быть не только слова, но и целые предложения значительного объема.
Подключение DTD для валидации XML-документов

Декларативный способ

Данный способ очень редко используется, так как его суть состоит в создании самодостаточных документов. То есть, документ будет сразу содержать и DTD и XML. Для добавления DTD в XML используется следующая конструкция.

где вместо DOCUMENT указываем корневой элемент XML-документа.

Для наглядности рассмотрим пример готового самодостаточного документа с декларативным способом включения DTD.

]>

Внешнее определение DTD — подключение DTD-документа

Суть данного метода состоит в том, чтобы подключить к XML-документу файл DTD при помощи следующей конструкции.

где DOCUMENT – указываем корневой элемент XML-документа.
file.dtd – ссылка на файл DTD.

Для наглядности рассмотрим следующий пример.

XML-документ

На этом данная статья подошла к концу. Все основные моменты при работе с XML DTD мы рассмотрели и, надеюсь, у меня получилось понятно все объяснить. Если вы не хотите пропустить выпуска других уроков по XML и XSLT, рекомендую подписаться на новостную рассылку, воспользовавшись формой ниже.

На этом все. Удачи вам и успехов в изучении XML!

DTD представляет собой совокупность синтаксических правил, на основе которых проверяется структура документа XML. В DTD явно определяется структура документа XML, указываются элементы и их атрибуты, а также приводится другая информация, распространяющаяся на все документы XML, созданные на основе данного DTD.

Учтите, что наличие DTD не является обязательным. Если DTD существует, система XML руководствуется им при интерпретации документа XML. Если DTD отсутствует, предполагается, что система XML должна интерпретировать документ по собственным правилам. Впрочем, для документов XML все же рекомендуется создавать DTD, поскольку это упрощает их интерпретацию и проверку структуры.

DTD можно включить непосредственно в документ XML, сослаться на него по URL или использовать комбинацию этих двух способов. При непосредственном включении DTD в документ XML определение DTD располагается сразу же после пролога:

Атрибут имя_корневого_элемента соответствует имени корневого элемента в тегах, содержащих весь документ XML. В секции «прочих объявлений» находятся определения элементов, атрибутов и т. д.

Возможно, вы предпочитаете разместить DTD в отдельном файле, чтобы обеспечить модульную структуру программы. Давайте посмотрим, как выглядит ссылка на внешний DTD в документе XML. Задача решается одной простой командой:

Как и в случае с внутренним объявлением DTD, имя_корневого_элемента должно соответствовать имени корневого элемента в тегах, содержащих весь документ XML. Атрибут SYSTEM указывает на то, что some_dtd.dtd находится на локальном сервере. Впрочем, на файл some_dtd.dtd также можно сослаться по его абсолютному URL. Наконец, в кавычках указывается URL внешнего DTD, расположенного на локальном или на удаленном сервере.

Как же создать DTD для листинга 14.1? Во-первых, мы собираемся создать в документе XML ссылку на внешний DTD. Как упоминалось в предыдущем разделе, ссылка на DTD выглядит так:

Возвращаясь к листингу 14.1, мы видим, что cookbook является именем корневого элемента, a cookbook.dtd - именем DTD-файла. Содержимое DTD показано в листинге 14.2, а ниже приведены подробные описания всех строк.

Листинг 14.2. DTD для листинга 14.1(cookbook.dtd)

] >

Что же означает этот загадочный документ? Несмотря на внешнюю сложность, в действительности он довольно прост. Давайте переберем все содержимое листинга 14.2:

Перед нами пролог XML, о котором уже говорилось выше.

Третья строка описывает элемент XML, в данном случае - корневой элемент cookbook. После него следует слово recipe, заключенное в круглые скобки. Это означает, что в теги cookbook заключается вложенный тег с именем recipe. Знак + говорит о том, что в родительских тегах cookbook находится одна или несколько пар тегов recipe.

Четвертая строка описывает тег recipe. В ней сообщается, что в тег recipe входят четыре вложенных тега: title, description, ingredients и process. Поскольку после имен тегов не указываются признаки повторения(см. следующий раздел), внутри тегов recipe должна быть заключена ровно одна пара каждого из перечисленных тегов.

Перед нами первое определение тега, который не содержит вложенных тегов. В соответствии с определением он содержит #PCDATA, то есть произвольные символьные данные, не считающиеся частью разметки.

В соответствии с определением элемент ingredients содержит один или несколько тегов с именем ingredient. Обратитесь к листингу 14.1, и вы все поймете.

Поскольку элемент ingredient соответствует отдельному ингредиенту, вполне логично, что этот элемент содержит простые символьные данные.

Элемент process содержит один или несколько экземпляров элемента step.

Элемент step, как и элемент ingredient, соответствует отдельному пункту в списке более высокого уровня. Следовательно, он должен содержать символьные данные.

Обратите внимание: элемент recipe в листинге 14.1 содержит атрибут. Этот атрибут, category, определяет общую категорию, к которой относится рецепт - в приведенном примере это категория «итальянская кухня»(Italian). В определении ATTLIST указывается как имя элемента, так и имя атрибута. Кроме того, отнесение каждого рецепта к определенной категории упрощает классификацию, поэтому атрибут объявляется обязательным(#REQUIRED).

Последняя строка просто завершает определение DTD. Определение всегда должно быть должным образом завершено, иначе произойдет ошибка.

В завершение этого раздела я приведу сводку основных компонентов типичного DTD-файла:

  • объявления типов элементов;
  • объявления атрибутов;
  • ID, IDREF и IDREFS;
  • объявления сущностей.

Некоторые из этих компонентов уже встречались нам в описании листинга 14.2. Далее каждый компонент будет описан более подробно.

Объявления элементов

Все элементы, используемые в документе XML, должны быть определены в DTD, прилагаемом к документу. Мы уже встречались с двумя распространенными разновидностями определений: для элемента, содержащего другие элементы, и элемента, содержащего символьные данные. Данное определение свидетельствует, что элемент содержит только символьные данные:

Следующее определение элемента process говорит о том, что он содержит ровно один вложенный элемент с именем step:

Впрочем, процессы(process) из одного шага(step) встречаются довольно редко - скорее всего, шагов будет несколько. Чтобы указать, что элемент содержит один или несколько экземпляров вложенного элемента step, следует воспользоваться признаком повторения:

Количество вложенных элементов можно задать несколькими способами. Полный список операторов элементов приведен в табл. 14.1.

Таблица 14.1. Операторы элементов

Если элемент будет содержать несколько вложенных элементов, их следует перечислить через запятую в определении родительского элемента:

Поскольку признаки повторения не указаны, каждый тег должен встречаться ровно один раз.

Определение элемента уточняется при помощи логических операторов. Предположим, вы работаете с рецептами, в которые всегда входят макароны(pasta) с одним или несколькими типами сыра(cheese) или мяса(meat). В этом случае элемент ingredient определяется следующим образом:

Поскольку элемент pasta обязательно должен присутствовать в элементе ingredient, он указывается с признаком повторения +. Затем следует либо элемент cheese, либо элемент meat; мы разделяем альтернативы вертикальной чертой и заключаем их в круглые скобки со знаком +, поскольку в рецепт всегда входит либо одно, либо другое.

Существуют и другие разновидности определений элементов. Мы рассмотрели лишь простейшие случаи. Тем не менее, приведенного материала вполне достаточно для понимания примеров, приведенных в оставшейся части этой главы.

Объявления атрибутов

Атрибуты элементов описывают значения, связываемые с элементами. Элементы XML, как и элементы HTML, могут иметь ноль, один или несколько атрибутов. Общий синтаксис объявления атрибутов выглядит следующим образом:

Имя_элемента определяет имя элемента, включаемое в тег. Затем перечисляются атрибуты, связанные с данным элементом. Объявление каждого атрибута состоит из трех основных компонентов: имени, типа данных и флага, определяющего особенности данного атрибута. Вместо многоточия(...) могут быть расположены объявления других атрибутов.

Простое объявление атрибута уже встречалось нам в листинге 14.2:

Тем не менее, как видно из приведенного общего определения, допускается одновременное объявление нескольких атрибутов. Допустим, в дополнение к атрибуту category вы хотите связать с элементом recipe дополнительный атрибут difficulty(сложность приготовления). Оба атрибута объявляются в одном списке:

Форматировать объявления подобным образом необязательно; тем не менее, многострочные объявления нагляднее однострочных. Кроме того, поскольку оба атрибута являются обязательными, тег reci ре не может ограничиться каким-нибудь одним атрибутом, он должен включать в себя оба атрибута сразу. Например, следующий тег будет считаться неверным:

Почему? Потому что в нем отсутствует атрибут category. Правильный тег должен содержать оба атрибута:

Особые условия обработки атрибута описываются тремя флагами, перечисленными в табл. 14.2.

Таблица 14.2. Флаги атрибутов

Типы атрибутов

Атрибут элемента может объявляться с определенным типом. Типы атрибутов описаны далее.

Атрибуты CDATA

Очень часто атрибуты содержат общие символьные данные. Такие атрибуты называются атрибутами CDATA. Следующий пример уже встречался в начале этого раздела:

Атрибуты ID, IDREF и IDREFS

Идея однозначного представления данных(например, информации о пользователе или товаре, хранящейся в базе данных) посредством идентификаторов неоднократно встречалась в предыдущих главах книги. Идентификаторы также часто используются в XML, поскольку перекрестные ссылки между документами применяются не только в общих задачах обработки данных, но и в World Wide Web(гиперссылки).

Идентификаторы элементов присваиваются атрибуту ID. Допустим, вы хотите связать с каждым рецептом уникальный идентификатор. Соответствующий фрагмент DTD может выглядеть так:

После этого объявление элемента recipe в документе может выглядеть так:

Spaghetti alla Carbonara

Рецепт однозначно определяется идентификатором ital003. Следует помнить, что атрибут redpe-id относится к типу ID, поэтому ital003 не может использоваться в качестве значения атрибута recipe-id другого элемента, в противном случае документ будет считаться синтаксически неверным. Теперь допустим, что позднее вы захотели сослаться на этот рецепт из другого документа - скажем, из списка любимых рецептов пользователя. Именно здесь в игру вступают перекрестные ссылки и атрибут IDREF. Атрибуту IDREF присваивается идентификатор, используемый для ссылок на элемент, - по аналогии с тем, как URL используется для идентификации страницы в гиперссылке. Рассмотрим следующий фрагмент кода XML:

В процессе обработки документа XML элемент заменяется более наглядной ссылкой на рецепт с указанным идентификатором(например, названием рецепта). Вероятно, он будет отформатирован в виде гиперссылки, чтобы упростить переход к указанному рецепту.

Перечисляемые атрибуты

При объявлении атрибута можно перечислить все допустимые значения, принимаемые атрибутом. В нашем примере это было бы удобно, поскольку вы можете сразу определить список допустимых категорий. Приведенное выше объявление записывается в следующем виде:

Обратите внимание: при использовании списков допустимых значений включать в объявление тип CDATA не нужно, поскольку все перечисленные значения относятся к формату CDATA.

Перечисляемые атрибуты со значением по умолчанию

Иногда бывает удобно объявить для атрибута значение по умолчанию. Скорее всего, вам уже приходилось делать это раньше при построении форм с раскрывающимися списками. Например, если большинство рецептов в вашей поваренной книге относится к итальянской кухне, атрибут recipe будет часто относиться к категории Italian. В этом случае категорию Italian можно назначить по умолчанию:

Если атрибут category не задан явно, по умолчанию ему присваивается значение Italian.

Атрибуты ENTITY и ENTITIES

Данные в документах XML не всегда являются текстовыми - документ может содержать и двоичную информацию(например, графику). На такие данные можно ссылаться при помощи атрибута entity. Например, в описании элемента description можно указать атрибут recipePicture с графическим изображением:

Также можно объявить сразу несколько сущностей, заменив ENTITY на ENTITIES. Значения разделяются пробелами.

Атрибуты NMTOKEN и NMTOKENS

Атрибуты NMTOKEN представляют собой строки из символов, входящих в ограниченный набор. Объявление атрибута с типом NMTOKEN предполагает, что значение атрибута соответствует установленным ограничениям. Как правило, значение атрибута NMTOKEN состоит из одного слова:

Можно объявить сразу несколько атрибутов, заменив NMTOKEN на NMTOKENS. Значения разделяются пробелами.

Объявления сущностей

Объявление сущности напоминает команду define в некоторых языках программирования, включая РНР. Ссылки на сущности кратко упоминались в предыдущем разделе «Знакомство с синтаксисом XML». На всякий случай напомню, что ссылка на сущность используется в качестве замены для другого фрагмента содержания. В процессе обработки документа XML все вхождения сущности заменяются содержанием, которое она представляет. Существует два вида сущностей: внутренние и внешние.

Внутренние сущности

Внутренние сущности напоминают строковые переменные, связывающие имя с фрагментом текста. Например, если вы хотите определить имя для ссылки на информацию об авторских правах, можно объявить сущность следующего вида:

В процессе обработки документа все экземпляры &Соруright заменяются текстом «Copyright 2000 YourCompanyName. All Rights Reserved». Весь код XML в заменяющем тексте обрабатывается так, словно он присутствовал в исходном документе.

Внутренние сущности удобны в ситуациях, когда вы планируете использовать сущность в относительно небольшом количестве документов XML. При большом количестве документов лучше воспользоваться внешними сущностями.

Внешние сущности

Внешние сущности используются для ссылок на содержание, находящееся в другом файле. Сущности этого типа могут содержать текстовую информацию, но также могут ссылаться и на двоичные данные(например, графику). Возвращаясь к предыдущему примеру, допустим, что вы решили сохранить информацию об авторских правах в отдельном файле, чтобы упростить ее редактирование в будущем. Ссылка на созданный файл выглядит следующим образом:

При последующей обработке документа XML все ссылки &Соруright заменяются содержимым документа copyright.xml. Весь код XML в заменяющем тексте обрабатывается так, словно он присутствовал в исходном документе.

Внешние сущности также удобно использовать для ссылок на графические изображения. Например, если вы хотите включить в документ XML графический логотип, создайте внешнюю сущность:

Ресурсы, посвященные XML

Хотя приведенного выше материала вполне достаточно для понимания базовой структуры документов XML, данное описание не является полным. Ниже приведены ссылки на ресурсы Интернета, содержащие более подробную информацию:

В оставшейся части главы рассказано о том, как использовать РНР для обработки документов XML. На первый взгляд задача кажется очень сложной(лексический анализ любых документов любого типа вызывает немало затруднений).

Но стоит познакомиться с базовой стратегией работы с XML в РНР, и все оказывается на удивление просто.