#include <xalanc/XercesParserLiaison/XercesParserLiaison.hpp>
#include <xalanc/XercesParserLiaison/XercesDOMSupport.hpp>
...
int main() {
...
DOMDocument* doc = ...;
XercesDOMSupport support;
XercesParserLiaison liaison(support);
XercesDOMWrapperParsedSource src(doc, liaison, support);
XalanDocument* xalanDoc = src.getDocument();
...
}
На следующем шаге получите указатель на узел, выполняющий роль узла контекста при вычислении выражения XPath. Это можно сделать с помощью интерфейса DOM документа XalanDocument
. Сконструируйте XPathEvaluator
для вычисления выражения XPath и XalanDocumentPrefixResolver
для разрешения префиксов пространств имен в документе XML. Наконец, вызовите метод XPathEvaluator::evaluate()
, передавая в качестве аргументов DOMSupport
, контекстный узел, XPath-выражение и PrefixResolver
. Результат вычисления выражения возвращается в виде объекта типа XObjectPtr
; тип допустимых операций над этим объектом зависит от типа его данных XPath, который можно узнать при помощи метода getType()
.
Например, пусть требуется извлечь список имен животных из документа animals.xml, представленного в примере 14.1. Вы можете это сделать, выполняя синтаксический анализ документа и вычисляя XPath-выражение animalList/animal/name/child::text()
с использованием корня документа в качестве контекстного узла. Это проиллюстрировано в примере 14.23.
Пример 14.23. Вычисление ХРаth-выражения, используя Xalan
#include <cstddef> // size_t
#include <exception>
#include <iostream> // cout
#include <xercesc/dom/DOM.hpp>
#include <xercesc/parsers/XercesDOMParser.hpp>
#include <xercesc/sax2/DefaultHandler.hpp>
#include <xercesc/util/PlatformUtils.hpp>
#include <xalanc/DOMSupport/XalanDocumentPrefixResolver.hpp>
#include <xalanc/XalanTransformer/XercesDOMWrapperParsedSource.hpp>
#include <xalanc/XercesParserLiaison/XercesParserLiaison.hpp>
#include <xalanc/XercesParserLiaison/XercesDOMSupport.hpp>
#include <xalanc/XPath/XObject.hpp>
#include <xalanc/XPath/XPathEvaluator.hpp>
#include "animal.hpp"
#include "xerces_strings.hpp"
using namespace std;
using namespace xercesc;
using namespace xalanc;
// Утилита RAII, которая инициализирует парсер и процессор XPath, освобождая
// ресурсы при выходе из области видимости
class XPathInitializer {
public:
XPathInitializer() {
XMLPlatformUtils::Initialize();
XPathEvaluator::initialize();
}
~XPathInitializer() {
XpathEvaluator::terminate();
XMLPlatformUtils::Terminate();
}
private:
// Запретить копирование и присваивание
XPathInitializer(const XPathInitializer&);
XPathInitializer& operator=(const XPathInitializer&);
};
// Получает уведомления об ошибках
class CircusErrorHandler : public DefaultHandler {
public:
void error(const SAXParseException& e) {
throw runtime_error(toNative(e.getMessage()));
}
void fatalError(const SAXParseException& e) { error(e); }
};
int main() {
try {
// Инициализировать Xerces и XPath и сконструировать парсер DOM.
XPathInitializer init;
XercesDOMParser parser;
// Зарегистрировать обработчик ошибок
CircusErrorHandler error;
parser.setErrorHandler(&error);
// Выполнить синтаксический анализ animals.xml.
parser.parse(fromNative("animals.xml").c_str());
DOMDocument* doc = parser.getDocument();
DOMElement* animalList = doc->getDocumentElement();
// Создать XalanDocument на основе doc.
XercesDOMSupport support;
XercesParserLiaison liaison(support);
XercesDOMWrapperParsedSource src(doc, liaison, support);
XalanDocument* xalanDoc = src.getDocument();
// Вычислить XPath-выражение для получения списка
// текстовых узлов, содержащих имена животных
XPathEvaluator evaluator;
XalanDocumentPrefixResolver resolver(xalanDoc);
XercesString xpath =
fromNative("animalList/animal/name/child::text()");
XObjectPtr result =
evaluator.evaluate(
support, // поддержка DOM
xalanDoc, // контекстный узел
xpath.c_str(), // XPath-выражение
resolver); // функция разрешения пространства имен
const NodeRefListBase& nodeset = result->nodeset();
// Просмотр списка узлов и вывод имен животных
for (size_t i = 0, len = nodeset.getLength(); i < len; ++i) {
const XMLCh* name = nodeset.item(i)->getNodeValue().c_str();
std::cout << toNative(name) << "\n";
}
} catch (const DOMException& e) {
cout << "xml error: " << toNative(e.getMessage()) << "\n";
return EXIT_FAILURE;
} catch (const exception& e) {
cout << e.what() << "\n";
return EXIT_FAILURE;
}
}
XPath — это язык поиска по образцу (pattern matching language), предназначенный для извлечения информации из документов XML. Основная конструкция XPath — выражение пути (path expression) поддерживает иерархический синтаксис ссылок на элементы, атрибуты и текстовые узлы на основе использования их имен, атрибутов, текстового содержимого, отношений наследования и других свойств. Кроме работы с наборами узлов язык XPath может обрабатывать строки, числа и булевы значения. XPath версии 2.0, которая в настоящее время не поддерживается библиотекой Xalan, использует даже более сложную модель данных, основанную на рекомендациях XML Schema. (См. рецепт 14.5.)
XPath-выражения вычисляются в контексте узла документа XML, называемого контекстным узлом, который используется для интерпретации связанной с ним конструкции, например, parent
, child
и descendant
. В примере 14.23 я указал корень (root
) документа XML в качестве контекстного узла; этот узел является родительским по отношению к корневому элементу документа XML, а также к любой инструкции обработки и комментариям верхнего уровня. При вычислении выражения с использованием корневого узла в качестве контекстного узла выражение пути animalList/animal/name/child::text()
соответствует всем текстовым узлам, дочерним по отношению к элементам name, родительским элементом которых является animal
, и чьим «дедушкой» является элемент animalList
.