У меня нет конкретной проблемы с кодом. Я просто не знаю, как решить следующую проблему с точки зрения логистики с помощью фреймворка Scrapy:
Структура данных, которые мне нужны для очистки обычно представляет собой строку таблицы для каждого элемента. Достаточно просто, не так ли?
В конечном итоге я хочу очистить Заголовок , Срок выполнения и Подробности для каждой строки. Заголовок и Срок сдачи сразу доступны на странице ...
НО самих Подробностей в таблице нет - скорее, ссылка на страницу, содержащую детали (если это не имеет смысла, вот таблица):
|-------------------------------------------------|
| Title | Due Date |
|-------------------------------------------------|
| Job Title (Clickable Link) | 1/1/2012 |
| Other Job (Link) | 3/2/2012 |
|--------------------------------|----------------|
Боюсь, я до сих пор не знаю, как логистически передать элемент с помощью обратных вызовов и запросов, даже после прочтения CrawlSpider раздел документации Scrapy.