XML в 10 тезисах

Мои записки
 

 

XML, XLink, пространство имен, DTD, схема, CSS, XHTML & # 8230; Если вы новичок в XML, даже трудно понять, с чего начать. Этот краткий обзор представляет собой попытку представить основные идеи XML, чтобы новичок мог увидеть концепцию в целом, не увязая в деталях. Но если вы представляете кому-то XML, почему бы не начать с этих 10 пунктов обсуждения?

1. XML — это способ записи структурированных данных

Слова обычно относятся к & # 171; структурированным данным & # 187; такие объекты, как электронные таблицы, адресные книги, параметры конфигурации, записи финансовых транзакций, технические чертежи и т.п. XML — это набор правил (вы также можете думать о них как о операторах или соглашениях) для создания текстовых форматов, которые позволяют структурировать данные. XML — это не язык программирования, и вам не нужно быть программистом, чтобы его использовать или изучать. XML упрощает компоновку и чтение данных для компьютера, обеспечивая при этом их однозначную структуру. XML избегает недостатков общеязыкового дизайна: он расширяемый, платформенно-независимый и включает поддержку интернационализации и локализации. XML полностью совместим с Unicode.

2. XML немного похож на HTML

Как и HTML, XML использует теги (слова, заключенные в & # 8216; & lt; & # 8216; и & # 8216; & gt; & # 8217; < / SPAN>) и атрибуты (в форме имя = & # 187; значение & # 187;). Однако, в то время как в HTML семантическое значение каждого тега и атрибута фиксировано и часто то, как текст между ними будет отображаться в браузере, в XML теги используются только для логической маркировки данных, а их интерпретация остается на усмотрение анализатора. Другими словами, если вы видите & # 171; & # 187; в файле XML не следует думать, что это абзац. В зависимости от контекста это может быть цена, параметр, человек & # 8230; (В любом случае, кто сказал, что это должно быть слово, начинающееся с & # 171; p & # 187;?)

3. XML — это текст, но не предназначен для чтения

Программы, работающие с электронными таблицами, адресными книгами или другими структурированными данными, часто записывают эти данные на диск в двоичном или текстовом формате. Одним из преимуществ текстового формата является то, что вы можете просматривать данные по мере необходимости, не используя программу, в которой они были созданы. Вы можете по крайней мере прочитать данные, сохраненные в текстовом формате, в своем любимом текстовом редакторе. Текстовые форматы также упрощают разработчикам отладку своих приложений. По этим причинам, как и файлы HTML, файлы XML являются текстовыми файлами: они не предназначены для чтения человеком, но могут быть прочитаны при необходимости. Однако правила для файлов XML намного строже, чем для HTML. Отсутствие тега или атрибута без кавычек сделает файл непригодным для использования, в то время как в HTML это явно разрешено или, по крайней мере, допустимо. Как указано в официальной спецификации XML, приложения не могут попытаться предсказать создателя недопустимого файла XML; если файл недействителен, приложение должно немедленно остановиться и сообщить об ошибке.

4. XML намеренно буквальный

Поскольку XML является текстовым форматом и использует теги для разметки данных, файлы XML почти всегда больше двоичных файлов. Это было сознательное решение дизайнеров XML. Преимущества текстового формата очевидны (см. Главу 3), а недостатки обычно можно компенсировать на другом уровне. Место на диске не так дорого, как раньше, и такие программы, как zip и gzip, могут очень хорошо и очень быстро сжимать текстовые файлы. Кроме того, протоколы связи, такие как модем и HTTP / 1.1 (основной сетевой протокол), могут сжимать данные «на лету», таким образом экономя полосу пропускания так же эффективно, как и при использовании двоичного кода.

5.XML — это семейство технологий

Спецификация XML 1.0 определяет, какие & # 171; теги & # 187; и & # 171; атрибуты & # 187;. Но за XML 1.0 последовало семейство & # 171; XML & # 187; постоянно растущий набор модулей, которые предоставляют полезные услуги для важных и частых задач. Например, спецификация XLink описывает стандартный способ добавления гиперссылок в XML-документ. XPointer — это синтаксис для адресации частей XML-документа. XPointer немного похож на URL-адрес, но вместо того, чтобы указывать на документы в Интернете, он указывает на фрагменты данных в файле XML. Каскадные таблицы стилей CSS можно применять к XML-документам так же, как и к HTML. XSL — это более продвинутый язык таблиц стилей. Он, в свою очередь, основан на XSLT, языке преобразования, который используется для изменения формы, добавления и удаления тегов и атрибутов. DOM — это стандартный интерфейс для управления файлами XML (и HTML) из различных языков программирования. XML Schema 1 и 2 предназначены для того, чтобы помочь разработчикам четко определить свои собственные XML-форматы. Многие другие модули и инструменты либо готовы к использованию, либо находятся в стадии разработки. Следите за обновлениями на странице технических отчетов W3C.

6. XML — это новинка, но не полностью.

Разработка XML началась в 1996 году и является стандартом W3C с февраля 1998 года, что может заставить вас думать об этой технологии как о довольно незрелой. Но на самом деле это не так уж и ново. До XML существовал SGML, разработанный в начале 1980-х годов и принятый в качестве стандарта ISO в 1986 году, который широко использовался в проектах, связанных с большим объемом документации. И, конечно же, HTML, разработка которого началась в 1990 году. Создатели XML просто взяли лучшее из SGML и использовали опыт HTML для создания чего-то нового, столь же мощного, как SGML, но гораздо более аккуратного и простого в использовании. Однако иногда эволюцию трудно отличить от революции — и следует отметить, что, хотя SGML используется в основном для технической документации и в гораздо меньшей степени для других типов данных, с XML верно обратное.

 7. XML ведет HTML к XHTML

Существует важный формат для документов XML: W3C XHTML, преемник HTML. Большинство элементов XHTML такие же, как и в HTML. Синтаксис был немного изменен для соответствия правилам XML. Документ & # 171; на основе XML & # 187; наследует синтаксис XML и каким-то образом ограничивает его (например, в XHTML допускается использование "& lt; p & gt;", но не "& lt; r & gt;" ); этому синтаксису также было придано семантическое значение (XHTML делает & # 171; & # 187; значение & # 171; параграф & # 187; (параграф), а не & # 171; price & # 187; (цена), & # 171; person & # 187; (человек) или что угодно).

8. XML  модульная технология

XML позволяет вам определять новые форматы документов, комбинируя и повторно используя уже созданные. Поскольку два формата, разработанные независимо друг от друга, могут иметь элементы или атрибуты с одинаковыми именами, следует проявлять осторожность при их объединении (чтобы различать & # 171; & # 171; означающее & # 171; параграф & # 187; в одном формат от & # 171; человек & # 187; во втором?). Чтобы исключить возможную путаницу при одновременном использовании разных форматов, XML предоставляет механизм пространства имен. XSL и RDF — хорошие примеры основанных на XML форматов, в которых используются пространства имен. Схема XML предназначена для отражения такой поддержки модульности на уровне определения структуры документа XML, облегчая процесс построения новой схемы из существующих.

9. XML — основа RDF и семантического Интернета

W3C Resource Description Framework (RDF) — это текстовый формат на основе XML, который обрабатывает описания ресурсов и метаданные приложений, такие как списки воспроизведения, фотогалереи и библиографии. Например, RDF может позволить вам идентифицировать людей в онлайн-фотоальбоме, используя информацию из вашего личного списка контактов;После этого ваша программа электронной почты может автоматически начать рассылку электронных писем этим людям, информируя их о том, что их фотографии размещены в Интернете. Подобно тому, как документы, меню и формы, связанные с HTML, сегодня образуют сеть, RDF соединяет приложения и агентов с семантической сетью. Подобно тому, как людям нужны соглашения о значениях слов, которые они используют для общения друг с другом, компьютерам нужен механизм для согласования значений терминов для эффективного общения. Формальные описания концепций из некоторой области (например, закупки или производства) называются онтологиями и являются обязательным элементом семантической паутины. RDF, онтологии и представление значений, позволяющее компьютерам помогать людям выполнять свою работу, — все это темы, связанные с деятельностью семантической паутины.

10. Технология XML не требует лицензии, не зависит от платформы и хорошо поддерживается

Выбрав XML в качестве основы для своего проекта, вы получаете доступ к широкому спектру продуктов и услуг.

XML в 10 тезисах

и постоянно растущее семейство инструментов (один из них уже может делать то, что вам нужно!), а также знания экспертов, работающих с этой технологией. Выбор XML немного похож на выбор SQL для баз данных: вам все равно нужно создать свою собственную базу данных и написать свои собственные программы и процедуры для работы с ней, но есть много инструментов и людей, которые могут вам помочь. А поскольку XML не требует лицензии, вы можете создавать собственное программное обеспечение, никому не платя ни копейки. Большая и постоянно растущая база поддержки означает, что вы не привязаны к какому-либо конкретному поставщику программного обеспечения. XML не всегда является лучшим решением, но его всегда стоит учитывать.

adm-tntwk
Оцените автора