Scrapy предоставляет вам поток для управления элементом в Pipelines
В Pipelines
вы можете проверить или применить любую проверку элемента, если она не соответствует вашим критериям или вы хотите обновить данные в зависимости от некоторых значений атрибутов, вы можете сделать там.
Подробнее о Pipelines
вы можете прочитать здесь
.
Для POJO к XML я предлагаю использовать JAXB (существуют другие библиотеки также, такие как XStream, например, но JAXB стандартизирован).
Для JSON я ничего не знаю, но если Вы хотите реализовать УСПОКОИТЕЛЬНЫЙ API, Вы могли бы интересоваться JSR-311, который определяет API серверной стороны для УСПОКОИТЕЛЬНЫХ API и Джерси , который является его ссылочной реализацией.
Используйте Xstream http://x-stream.github.io/ для xml и JSON http://www.json.org/java/ для JSON. Я не думаю, что существует одна библиотека, которая делает обоих.
Или запись обертка, которая делегирует к XStream renderers/JSON рендереры в зависимости от того, что Вы хотите.
Я думаю, что можно искать что-то подобное тому, что здесь: раздел JSON.org Java
Json-lib лицензируют в соответствии с лицензией Apache 2.0.
Это может также преобразовать объекты JSON к XML, но необходимо было бы преобразовать POJOs в JSON через него сначала.
Лично я занялся бы двумя отдельно; и преобразовать JSON<-> XML через JSON<-> Pojo <-> XML.
С этим: Java<-> POJO с JAXB ( http://jaxb.dev.java.net ; также связанный JDK 1.6) с аннотациями (XStream в порядке также); и для JSON, ObjectMapper Jackson ( http://jackson.codehaus.org/Tutorial ). Работы приятно с Джерси, и я - использование это сам (текущая версия Джерси не связывает полную привязку данных Pojo по умолчанию, но будет в ближайшем будущем)
, я на самом деле не использовал бы ни одного из xml, освобождает для создания "json": XStream и JAXB/Jettison могут произвести вид JSON, но он использует ужасные конвенции, которые довольно неинтуитивны.
РЕДАКТИРОВАНИЕ (18 июля 2011): у Jackson на самом деле есть расширение, названное" jackson-xml-databind", который может чтение-запись XML, подобный JAXB. Таким образом, это может использоваться и для JSON и для XML, к/от POJOs.
В последний раз я видел на веб-сайте, XStream сделает обоих. Это поддерживает XML и JSON как цели сериализации.