9
ответов

Извлечь часть файла XML [duplicate]

У меня есть большой XML-файл с повторяющимися частями. Как я могу извлечь эти части «как есть» один на один в Java? Как я сказал, файл огромный, поэтому я не могу загрузить его в память. Какую технологию / библиотеку я должен использовать ...
вопрос задан: 15 March 2013 19:20
8
ответов

Есть ли какой-либо процессор XPath для модели SAX?

Я ищу средство анализа XPath, которое не восстанавливает целый документ DOM для поиска узлов документа: на самом деле объект состоит в том, чтобы управлять большой суммой данных XML (идеально более чем 2 ГБ) с...
вопрос задан: 8 April 2012 20:09
8
ответов

Dom По сравнению с Саксофоном - создание Xmls

Я знаю, что различия между Sax и Dom являются довольно существенными относительно парсинга Xml, но что относительно того, чтобы создать? есть ли даже способ создать новый Xml с помощью Саксофона или этого, если я хочу создать новый...
вопрос задан: 25 February 2010 07:27
7
ответов

Легкий синтаксический анализатор XML, эффективный для больших файлов?

Я должен проанализировать потенциально огромные XML-файлы, таким образом, я предполагаю, что это исключает синтаксические анализаторы DOM. Там какой-либо хороший легкий синтаксический анализатор SAX для C++, сопоставимого с TinyXML на месте? Структура XML
вопрос задан: 17 June 2009 11:53
5
ответов

РЕ: Большой XML-файл

Последующий вопрос Большому XML-файлу: Сначала большое спасибо за Ваш ответы. После …, что я делаю неправильно? Это - мой класс, который использует SAX: общедоступный класс SAXParserXML расширяет DefaultHandler {общедоступные помехи...
вопрос задан: 23 May 2017 12:30
5
ответов

Основанное на XPath извлечение содержания от страниц HTML

Я пытаюсь извлечь на основе содержимого на данном xpath. Когда это - всего один элемент, я хочу извлечь, нет никакой проблемы. Когда у меня есть список объектов, соответствующих этому xpath, затем я получаю nodelist, и я могу...
вопрос задан: 25 August 2010 14:36
5
ответов

Действительно ли XPath намного более эффективен по сравнению с DOM и SAX?

Я должен проанализировать строку xml и найти значения определенных текстовых узлов, значения атрибута и т.д. Я делаю это в JavaScript и использовал класс DOMParser для того же. Позже мне сообщили это DOM...
вопрос задан: 27 March 2009 09:44
5
ответов

Парсинг очень больших XML-документов (и немного больше) в Java

(Все следующее должно быть записано в Java), я должен создать приложение, которое возьмет в качестве входных XML-документов, которые являются, потенциально, очень большими. Документ шифруется - не с XMLsec...
вопрос задан: 10 December 2008 12:41
4
ответа

Как я могу обработать xml асинхронно в Python?

У меня есть большой файл данных XML (> 160M) для обработки, и кажется, что парсинг SAX/expat/pulldom является способом пойти. Я хотел бы иметь поток, который отсеивает через узлы и продвигает узлы быть обработанными...
вопрос задан: 18 January 2010 23:59
4
ответа

SAX по сравнению с XmlTextReader - SAX в C#

Я пытаюсь прочитать большой XML-документ, и я хотел сделать это в блоках по сравнению со способом XmlDocument считать весь файл в память. Я знаю, что могу использовать XmlTextReader, чтобы сделать это, но я задавался вопросом...
вопрос задан: 10 November 2009 22:29
3
ответа

XML, анализирующий - ElementTree по сравнению с SAX и DOM

Python имеет несколько способов проанализировать XML... Я понимаю самые основы парсинга с SAX. Это функционирует как потоковый синтаксический анализатор с событийно-ориентированным API. Я понимаю синтаксический анализатор DOM также. Это читает...
вопрос задан: 5 September 2018 22:50
3
ответа

Парсинг саксофона и кодирование

У меня есть контакт, который испытывает проблему с SAX при парсинге файлов Atom и RSS. По его словам, это - как будто текст, прибывающий из элементов Объекта, является усеченным в апострофе или иногда...
вопрос задан: 6 May 2017 16:02
3
ответа

Парсинг плохо отформатированного HTML в PHP

В моем коде я преобразовываю, некоторые разработали xls документ HTML с помощью openoffice. Я затем анализирую таблицы с помощью xml_parser_create. Проблема состоит в том, что openoffice создает oldschool HTML с открытым <BR>...
вопрос задан: 4 April 2017 10:41
3
ответа

Как выбрать саксонский TransformerFactory в Java

В моем веб-приложении я должен использовать саксонский TransformerFactory для использования XSLT 2.0, но я не могу использовать setProperty метод, потому что я не имею этого права на веб-сервере и существует безопасность...
вопрос задан: 30 April 2015 12:41
3
ответа

Разметка должна быть правильно построена

Прежде всего позвольте мне сказать, что я - новое для SAX и Java. Я пытаюсь считать информацию из XML-файла, который не хорошо формируется. Когда я пытаюсь использовать SAX или Синтаксический анализатор DOM, я вкладываю следующую ошибку...
вопрос задан: 4 June 2013 17:45
3
ответа

Java мониторинг прогресса синтаксического анализатора SAX

Я пишу синтаксический анализатор SAX в Java для парсинга XML-файла на 2.5 ГБ статей Википедии. Существует ли способ контролировать прогресс парсинга в Java?
вопрос задан: 23 June 2010 08:21
3
ответа

Как сказать Java Синтаксический анализатор SAX для игнорирования ссылок недопустимого символа?

При попытке проанализировать неправильный XML с символьной ссылкой, такой как &#x1, Синтаксический анализатор SAX Java умирает ужасной смертью с фатальной ошибкой, такой как org.xml.sax. SAXParseException: Символ...
вопрос задан: 8 June 2010 12:33
3
ответа

Установка кодирования для синтаксического анализатора саксофона в Python

Когда я питаюсь, utf-8 закодировал xml к экземпляру ExpatParser: тест определения (имя файла): синтаксический анализатор = xml.sax.make_parser () с codecs.open (имя файла, 'r', кодируя ='utf-8') как f: для строки в f:...
вопрос задан: 13 May 2009 13:13
3
ответа

Java Синтаксический анализатор SAX повышает UnknownHostException

XML-файл, который я хочу проанализировать, запускается с: <! DOCTYPE plist ОБЩЕСТВЕННОСТЬ "-//...//DTD PLIST 1.0//EN" "http://www.....dtd"> Поэтому, когда я запускаю SAX praser, он пытается получить доступ к этому DTD онлайн и мн
вопрос задан: 17 November 2008 15:00
2
ответа

добавление существующего XML в java [duplicate]

В моем коде мне нужно проверить, существует ли файл (xml) или нет. если существует, мне нужно его прочитать (проанализировать) и добавить к нему, порядок не имеет значения, поэтому я могу добавить его в любом месте. если не существует, я должен создать
вопрос задан: 17 September 2014 10:11
2
ответа

Java Android SAX Parse - Потерянные символы случайным образом [дублировать]

Im пытается разобрать XML-строку (с 1052 элементами), и ответ немного странный. Все данные хорошо разбираются, но в некоторых случаях данные выглядят раздробленными. Список значений широт и ...
вопрос задан: 17 October 2011 20:57
2
ответа

Проанализируйте XML-файл на BlackBerry

Я хочу знать, как проанализировать данные XML на BlackBerry. Я считал где-нибудь, что JSON является хорошим методом проанализировать данные XML. Там какие-либо учебные руководства должны проанализировать данные XML с помощью JSON или какого-либо другого м
вопрос задан: 25 October 2010 15:27
2
ответа

Используя SAX для парсинга общих элементов XML

Я в настоящее время использую SAX (Java) для парсинга горстки различные XML-документы с каждым документом, представляющим различные данные и имеющим немного отличающиеся структуры. Поэтому каждый XML...
вопрос задан: 4 August 2010 12:57
2
ответа

Игнорирование “Содержания не позволяется в запаздывающем разделе” SAXException

Я использую DocumentBuilder.parse(InputStream) Java для парсинга XML-документа. Иногда, я получаю уродливые XML-документы, в которых существует дополнительный спам после финала>, который вызывает SAXException:...
вопрос задан: 11 May 2010 23:17
2
ответа

ошибочный спам “саксофона Python после элемента документа”

Я использую саксофон Python для парсинга XML-файла. XML-файл является на самом деле комбинацией нескольких XML-файлов. Это похоже следующим образом: <название строки = возраст "abc" = "40" тело = "blalalala..." creationdat
вопрос задан: 4 April 2010 15:23
2
ответа

Парсинг поврежденного XML с lxml.etree.iterparse

Я пытаюсь проанализировать огромный XML-файл с lxml в памяти эффективный способ (т.е. передаю потоком лениво от диска вместо того, чтобы загрузить целый файл в памяти). К сожалению, файл содержит некоторый плохой ASCII...
вопрос задан: 1 March 2010 00:11
2
ответа

Java: Сохранение StreamResult в файл

Я делаю некоторое преобразование данных (как csv) к xml с SAX затем с помощью преобразователя в Java. Результат находится в StreamResult, и я пытаюсь сохранить этот результат к file.xml, но я не могу найти способ сохранить...
вопрос задан: 21 December 2009 01:00
2
ответа

Проверка схемы, как отобразить удобные для пользователя сообщения проверки?

Существует ли способ избежать или настроить схему для отображения лучше удобных для пользователя сообщений? Я анализирую строку и использую reg исключая интерпретировать их, но мог бы быть лучший путь.напр. "Cvc-комплекс-...
вопрос задан: 28 September 2009 19:37
2
ответа

Синтаксический анализатор XML для Ruby

Поиск чего-то подобного xerces для парсинга XML-файла в рубине. Я видел собственный процессор REXML, и другой назвал hpricot (хотя я не могу найти документацию относительно hpricot, ссылки все...
вопрос задан: 2 September 2009 18:18
2
ответа

Как прекратить анализировать xml документ с SAX когда-либо?

Я анализирую большой xml документ с Саксофоном, я хочу прекратить анализировать документ, когда некоторое условие устанавливает? Как сделать?
вопрос задан: 28 August 2009 06:14