Рецепты 14.1, 14.4, 14.5 и 14.6.
14.4. Манипулирование документом XML
Требуется представить документ XML в виде объекта С++, чтобы можно было манипулировать его элементами, атрибутами, текстом, DTD, инструкциями обработки и комментариями
Используйте реализованную в Xerces модель W3C DOM. Во-первых, используйте класс xercesc::DOMImplementationRegistry
для получения экземпляра xercesc::DOMImplementation
, затем используйте DOMImplementation
для создания экземпляра парсера xercesc::DOMBuilder
. На следующем шаге зарегистрируйте экземпляр xercesc::DOMErrorHandler
для получения уведомлений об ошибках, обнаруженных в ходе анализа, и вызовите метод парсера parseURI()
, передавая в качестве аргумента URI документа XML или полное имя файла. Если анализ документа завершается успешно, метод parseURI
возвратит указатель на объект DOMDocument
, представляющий документ XML. Затем вы можете использовать функции, определенные в спецификации W3C DOM для просмотра и манипулирования документом.
Обработав документ, вы можете сохранить его в файле, получая DOMWriter
из DOMImplementation
и вызывая его метод writeNode()
с передачей указателя на DOMDocument
в качестве аргумента.
Пример 14.10 показывает, как можно использовать DOM для синтаксического анализа документа animals.xml, приведенного в примере 14.1, затем найти и удалить узел, относящийся к слону Herby, и сохранить модифицированный документ.
Пример 14.10. Применение DOM для загрузки, модификации и затем сохранения документа XML
#include <exception>
#include <iostream> // cout
#include <xercesc/dom/DOM.hpp>
#include <xercesc/framework/LocalFileFomatTarget.hpp>
#include <xercesc/sax/SAXException.hpp>
#include <xercesc/util/PlatformUtils.hpp>
#include "animal.hpp"
#include "xerces_strings.hpp"
using namespace std;
using namespace xercesc;
/*
* Определить XercesInitializer, как это сделано в примере 14.8
*/
// Утилита RAII, которая освобождает ресурс при выходе из области видимости.
template<typename T>
class DOMPtr {
public:
DOMPtr(T* t) : t_(t) {}
~DOMPtr() { t_->release(); }
T* operator->() const { return t_; }
private:
// запретить копирование и присваивание
DOMPtr(const DOMPtr&);
DOMPtr& operator=(const DOMPtr&);
T* t_;
};
// Сообщает об ошибках, обнаруженных в ходе синтаксического анализа с
// использованием DOMBuilder.
class CircusErrorHandler : public DOMErrorHandler {
public:
bool handleFrror(const DOMError& e) {
std::cout << toNative(e.getMessage()) << "\n";
return false;
}
};
// Возвращает значение элемента "name", дочернего по отношению к элементу
// "animal".
const XMLCh* getAnimalName(const DOMElement* animal) {
static XercesString name = fromNative("name");
// Просмотреть дочерние элементы объекта animal
DOMNodeList* children = animal->getChildNodes();
for (size_t i = 0, len = children->getLength(); i < Len; ++i) {
DOMNode* child = children->item(i);
if (child->getNodeType() == DOMNode::ELEMENT_NODE &&
static_cast<DOMElement*>(child)->getTagName() == name) {
// Мы нашли элемент "name".
return child->getTextContent();
}
}
return 0;
}
int main() {
try {
// Инициализировать Xerces и получить DOMImplementation;
// указать, что требуется функция загрузки и сохранения (Load and
// Save - LS)
XercesInitializer init;
DOMImplementation* impl =
DOMImplementationRegistry::getDOMImplementation(fromNative("LS").c_str()
);
if (impl == 0) {
cout << "couldn't create DOM implementation\n";
return EXIT_FAILURE;
}
// Сконструировать DOMBuilder для анализа документа animals.xml.
DOMPtr<DOMBuilder> parser =
static_cast<DOMImplementationLS*>(impl)->
createDOMBuilder(DOMImplementationLS::MODE_SYNCHRONOUS, 0);
// Подключить пространства имен (они не требуются в этом примере)
parser->setFeature(XMLUni::fgDOMNamespaces, true);
// Зарегистрировать обработчик ошибок
CircusErrorHandler err;
parser->setErrorHandler(&err);
// Выполнить синтаксический анализ animals.xml; здесь можно
// использовать URL вместо имени файла
DOMDocument* doc =
parser->parseURI("animals.xml");
// Найти элемент слона Herby: сначала получить указатель на элемент
// "animalList".
DOMElement* animalList = doc->getDocumentElement();
if (animalList->getTagName() != fromNative("animalList")) {
cout << "bad document root: "
<< toNative(animalist->getTagName()) << "\n";
return EXIT_FAILURE;
}
// Затем просматривать элементы "animal", пытаясь найти элемент слона
// Herby.
DOMNodeList* animals =
animaIList->getElementsByTagName(fromNative("animal").c_str());
for (size_t i = 0,
len = animals->getLength(); i < len; ++i) {
DOMElement* animal =
static_cast<DOMElement">(animals->item(i));
const XMLCh* name = getAnimalName(animal);
if (name != 0 && name == fromNative("Herby")) {
// Herby найден - удалить его из документа.
animalList->removeChild(animal);
animal->release();
// необязательный оператор.
break;
}
}
// Сконструировать DOMWriter для сохранения animals.xml.
DOMPtr<DOMWriter> writer =