Моя цель - извлечь html из всех ссылок на первой странице после ввода поискового запроса Google. Я работаю за прокси, так что это мой подход.
1. Я сначала использовал механизировать для ввода поискового запроса в форму, я правильно настроил прокси и роботов.
2. После извлечения ссылок я использовал средство открытия, использующее urllib2.ProxyHandler глобально, чтобы открыть URL-адреса по отдельности.
Однако это дает мне эту ошибку. Не в силах разобраться.
urlopen error [Errno 8] _ssl.c:504: EOF occurred in violation of protocol