Я пытаюсь создать приложение Django, которое работает как магазин. Элементы собираются со всего Интернета и постоянно обновляют базу данных проекта Django (скажем, каждые несколько дней). Я использую среду Scrapy для выполнения парсинга, и хотя есть экспериментальная функция DjangoItem , я бы предпочел держаться подальше от нее, потому что она нестабильна.
Сейчас я планирую создать XML-файлы сканировал элементы с помощью Scrapy XMLItemExporter
(документы здесь ) и использовали их для загрузки данных
в проект Django как фикстур XML (документы здесь ) . Кажется, это нормально, потому что, если один из двух процессов ошибается, между ними существует файловый посредник. Модуляризация приложения в целом тоже не кажется плохой идеей.
Некоторые опасения:
loaddata
Django. Существование экспериментального DjangoItem предполагает, что Scrapy + Django - достаточно популярный выбор, чтобы найти здесь хорошее решение.
Я был бы очень признателен за любые решения, советы или мудрость по этому поводу.