Как я могу получить правильный ответ от скрапа?

В общем, все может быть оправданным, если оно соответствует требованиям вашего проекта. Это не означает, что люди согласятся или хотят защитить ваше решение ...

В общем, хранение данных таким образом является субоптимальным (например, сложнее выполнять эффективные запросы) и может вызвать проблемы с обслуживанием, если вы изменяете элементы в своей форме. Возможно, вы могли бы найти среднюю землю и вместо нее использовать целое число, представляющее набор битовых флагов?

0
задан Hi tE 24 March 2019 в 20:44
поделиться

1 ответ

Как я вижу, вы хотите получить все тексты в тегах a и p, и в этих тегах много tags.

Попробуйте это и удалите ненужные пробелы через regex:

import scrapy
import re

class QuotesSpider(scrapy.Spider):

    name = 'gov2'
    start_urls = ['https://beta.companieshouse.gov.uk/search/companies?q=a']

    def parse(self, response):

      for i in response.css('ul.results-list'):
         yield {
          'company_name': re.sub('\s+',' ',''.join(i.css('li.type-company h3 a ::text').extract())),
          'address': re.sub('\s+',' ',''.join(i.css('li.type-company p ::text').extract())),
      }
0
ответ дан Pankaj 24 March 2019 в 20:44
поделиться
Другие вопросы по тегам:

Похожие вопросы: