Я вставляю некоторый код здесь, который компилирует без предупреждения gcc file.c-lxml2 использования, предполагая, что libxml2 установлен в Вашей системе.
#include <libxml/parser.h>
#include <libxml/xpath.h>
#include <assert.h>
#include <libxml/tree.h>
#include <libxml/xpathInternals.h>
xmlDocPtr
getdoc (char *docname) {
xmlDocPtr doc;
doc = xmlParseFile(docname);
if (doc == NULL ) {
fprintf(stderr,"Document not parsed successfully. \n");
return NULL;
}
return doc;
}
xmlXPathObjectPtr
getnodeset (xmlDocPtr doc, xmlChar *xpath){
xmlXPathContextPtr context;
xmlXPathObjectPtr result;
context = xmlXPathNewContext(doc);
if (context == NULL) {
printf("Error in xmlXPathNewContext\n");
return NULL;
}
if(xmlXPathRegisterNs(context, BAD_CAST "new", BAD_CAST "http://www.example.com/new") != 0) {
fprintf(stderr,"Error: unable to register NS with prefix");
return NULL;
}
result = xmlXPathEvalExpression(xpath, context);
xmlXPathFreeContext(context);
if (result == NULL) {
printf("Error in xmlXPathEvalExpression\n");
return NULL;
}
if(xmlXPathNodeSetIsEmpty(result->nodesetval)){
xmlXPathFreeObject(result);
printf("No result\n");
return NULL;
}
return result;
}
int
main(int argc, char **argv) {
char *docname;
xmlDocPtr doc;
xmlChar *xpath = (xmlChar*) "/new:book/section1";
xmlNodeSetPtr nodeset;
xmlXPathObjectPtr result;
int i;
xmlChar *keyword;
if (argc <= 1) {
printf("Usage: %s docname\n", argv[0]);
return(0);
}
docname = argv[1];
doc = getdoc(docname);
result = getnodeset (doc, xpath);
if (result) {
nodeset = result->nodesetval;
for (i=0; i < nodeset->nodeNr; i++) {
keyword = xmlNodeListGetString(doc, nodeset->nodeTab[i]->xmlChildrenNode, 1);
printf("keyword: %s\n", keyword);
xmlFree(keyword);
}
xmlXPathFreeObject (result);
}
xmlFreeDoc(doc);
xmlCleanupParser();
return (1);
}
Моя проблема состоит в том, что я хочу проанализировать следующий xml
<?xml version="1.0" encoding="UTF-8"?>
<book xmlns="http://www.example.com/new">
<section1>Sec_1</section1>
<section2>Sec_2</section2>
</book>
книжный элемент определяет пространство имен в том элементе. Я хочу распечатать значение в xpath/book/section1, и это возвращает ПУСТОЙ УКАЗАТЕЛЬ. Когда я пытаюсь возвратить элемент под пространством имен, я также получаю ошибки, т.е./new:book/section1
Я предполагаю, что мой код перестал работать, потому что я не использую правильно префиксы пространства имен. У меня заканчивается время. Вы могли помочь?
это проблема с пространством имен по умолчанию. Для соответствия пути вам нужен / new: tag / new: tag и так далее
Это досадный сбой библиотеки libXml. Как отмечает cateof, проблема заключается в объявлении пространства имен по умолчанию:
xmlns = "http://www.example.com/new"
Два варианта:
(1) избавьтесь от этого объявления в теге вашей книги
или
(2) дайте ему имя и используйте это имя в своих тегах.
например.
xmlns: new = "http://www.example.com/new"
Тогда все ваши теги будут выглядеть так:
new: book new: section1
и так далее.
Оказывается, как я узнал из здесь , на самом деле это не сбой libXml, это проблема, потому что libXml правильно следует спецификациям XML / XPATH.
Решения, предложенные Р. Бурдо, правильны, однако, если у вас есть контроль над XML-документом, который вы анализируете.
Контекст запроса XPATH не зависит от квалификаторов пространства имен в XML-документе. Пространство имен по умолчанию принудительно помещает все дочерние теги в пространство имен; они не требуют квалификации в документе , но должны быть квалифицированы в запросе xpath. К счастью, вы зарегистрировали пространство имен как new
с помощью libXml, поэтому решение cateof должно работать.
xmlXPathRegisterNs(context, BAD_CAST "new", BAD_CAST "http://www.example.com/new"
xmlChar *xpath = (xmlChar*) "/new:book/new:section1";
Я вставляю здесь xml для наглядности:
<?xml version="1.0" encoding="UTF-8"?>
<book xmlns="http://www.example.com/new">
<section1>Sec_1</section1>
<section2>Sec_2</section2>
</book>