Есть ли простой способ очистить Google и написать текст (только текст) первых N (скажем, 1000) .html (или любых других) документов для заданный поиск?
В качестве примера представьте, что вы ищете фразу «большой злой волк» и загружаете только текст из 1000 самых популярных запросов, то есть фактически загружаете текст с этих 1000 веб-страниц (но только с этих страниц, не весь сайт).
Я предполагаю, что здесь будет использоваться библиотека urllib2? Я использую Python 3.1, если это помогает.