Часто случается, что различные логические схемы документов используют одни и те же имена элементов в различных смыслах. Это не является проблемой, если в документе используется только одна схема. Но представьте себе ситуацию, когда в одном и том же документе необходимо использовать элементы нескольких различных схем — будет попросту невозможно определить, какой элемент относится к какой схеме, и, вообще, какие схемы были использованы в документе. Для решения этих проблем в XML используются пространства имен (англ. namespaces).
Чтобы различать схемы документов, каждой из них ставится в соответствие уникальный идентификатор ресурса (URI). Две схемы будут считаться тождественными тогда и только тогда, когда их уникальные идентификаторы будут совпадать, поэтому нужно осторожно выбирать URI для создаваемой схемы документа. Очень часто в качестве URI используются URL различных Web-сайтов. Это совсем не означает, что по указанному адресу должно что-либо находиться, просто такой способ практически гарантирует уникальность — вряд ли кому придет в голову использовать адрес чужого сервера в качестве идентификатора своей схемы.
Уникальный идентификатор языка XSLT, которому посвящена эта книга, имеет вид:
http://www.w3.org/1999/XSL/Transform
Для того чтобы определить, какой схеме принадлежит тот или иной элемент в документе, можно использовать механизм префиксов. Префиксы пространств имен задаются как атрибуты с именами, начинающимися последовательностью xmlns
, и имеют следующий вид:
<префикс:элемент xmlns:префикс="URI">
...
</префикс:элемент>
В XSLT чаще всего используется префикс xsl
, который задается, как правило, следующим образом:
<xsclass="underline" stylesheet
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="1.0">
...
</xsclass="underline" stylesheet>
При этом ничто не мешает использовать любой другой префикс. Например, следующий фрагмент документа будет совершенно идентичен предыдущему:
<www:stylesheet
xmlns:www="http://www.w3.org/1999/XSL/Transform"
version="1.0">
...
</www:stylesheet>
Префиксы, которые были определены в некотором элементе, могут быть использованы в его собственном имени, а также в именах всех элементов, которые включены в него.
<!-- Здесь еще нельзя использовать префикс aaa -->
<aaa:element xmlns:aaa="http://www.aaa.com">
<!-- Здесь уже можно использовать префикс aaa -->
<ааа:anotherelement/>
...
</aaa:element>
<!-- А здесь снова нельзя -->
Принадлежность элементов той или иной схеме определяется не префиксами, а тем, какие уникальные идентификаторы поставлены этим префиксам в соответствие. То есть два элемента с разными префиксами, заданными одинаковыми идентификаторами, будут считаться принадлежащими одной схеме.
В следующем фрагменте
<xslt:stylesheet
xmlns:xslt="http://www.w3.org/1999/XSL/Transform"
version="1.0">
<xsclass="underline" template xmlns:xsl="http://www.w3.org/1999/XSL/Transform"/>
...
</xslt:stylesheet>
элементы stylesheet
и template
имеют различные префиксы, но, несмотря на это, принадлежат одной и той же схеме.
В одном элементе можно определять несколько префиксов пространств имен. Как правило, при использовании множества префиксов, все они определяются в корневом элементе, а затем используются по всему документу.
<aaa:element
xmlns:aaa="http://www.ааа.com"
xmlns:bbb="http://www.bbb.com"
xmlns:ccc="http://www.ccc.com">
<aaa:anotherelement/>
<ccc:element/>
<bbb:anotherelement/>
...
</aaa:element>
Весьма удобной является возможность использования пространства имен по умолчанию. Определение пространства имен в виде
<элемент xmlns="URI">
...
</элемент>
позволяет опускать префиксы в именах элементов.
Документ в предыдущем примере может быть переписан следующим образом:
<element xmlns="http://www.aaa.com">
<anotherelement/>
<ссс:element xmlns:ccc="http://www.ccc.com"/>
<anotherelement xmlns="http://www.bbb.com"/>
...
</element>
Обратим внимание, что пространство имен по умолчанию может быть изменено повторным использованием атрибута xmlns
в дочерних элементах.
Документ
<element xmlns="http://www.ааа.com">
<element/>
<element xmlns="http://www.bbb.com">
<element/>
<element xmlns="http://www.ccc.com"/>
</element>
</element>
эквивалентен документу
<aaa:element
xmlns:aaa="http://www.aaa.com"
xmlns:bbb="http://www.bbb.com"
xmlns:ccc="http://www.ccc.com">
<aaa:element/>
<bbb:element>
<bbb:element/>
<ccc:element/>
</bbb:element>
</aaa:element>
Таким образом, пространства имен — это механизм выделения в тексте XML-документа элементов и атрибутов, принадлежащих различным логическим схемам документов. Более того, термин "пространство имен" часто используется как эквивалент логической схеме документа, например, когда говорят "элемент template
принадлежит пространству имен XSLT", подразумевается, что элемент template
определен в языке XSLT и описывается в соответствующей схеме.
Синтаксические правила, которые описывают определения пространств имен, задаются не в спецификации XML, а в другом документе — в технической рекомендации "Namespaces in XML" (пространства имен в XML), которая доступна по адресу http://www.w3.org/TR/REC-xml-names. Для того чтобы отличать эти продукции от продукций языка XML, мы будет давать им номера вида [NS1]
, [NS2]
и так далее.
Продукция NSAttName
описывает имена атрибутов, декларирующих пространства имен:
[NS1] NSAttName ::= PrefixedAttName | DefaultAttName
[NS2] PrefixedAttName ::= 'xmlns:' NCName