Выберите статью Wikipedia с Python

39
задан unutbu 16 February 2013 в 15:48
поделиться

6 ответов

Необходимо использовать urllib2, который заменяет urllib в библиотека станд. Python для изменения агента пользователя.

Прямо от эти примеры

import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
infile = opener.open('http://en.wikipedia.org/w/index.php?title=Albert_Einstein&printable=yes')
page = infile.read()
51
ответ дан octosquidopus 27 November 2019 в 02:10
поделиться

Это не решение определенной проблемы. Но это могло бы быть межжало для Вас для пользований mwclient библиотекой ( http://botwiki.sno.cc/wiki/Python:Mwclient ) вместо этого. Это было бы настолько легче. Тем более, что Вы непосредственно получите содержание статьи, который устраняет необходимость Вас проанализировать HTML.

я использовал его сам для двух проектов, и это работает очень хорошо.

36
ответ дан Hannes Ovrén 27 November 2019 в 02:10
поделиться

Общее решение, которое я использую для любого сайта, состоит в том, чтобы получить доступ к странице с помощью Firefox и, с помощью расширения, такого как Firebug, записать все детали Запроса HTTP включая любые cookie.

В Вашей программе (в этом случае в Python) необходимо попытаться отправить Запрос HTTP, столь же подобный по мере необходимости тому, который работал из Firefox. Это часто включает установку Агента пользователя, полей Referer и Cookie, но могут быть другие.

2
ответ дан Liam 27 November 2019 в 02:10
поделиться

Попытайтесь изменить заголовок агента пользователя, как который Вы отправляете в своем запросе к чему-то: агент пользователя: Mozilla/5.0 (X11; U; Linux i686; en-США; rv:1.9.0.1) Геккон/2008072820 Ubuntu/8.04 (Харди) Firefox/3.0.1 (Linux Mint)

1
ответ дан Vasil 27 November 2019 в 02:10
поделиться

Вы не должны являться олицетворением агента пользователя браузера; любой агент пользователя вообще будет работать, просто не пустой.

1
ответ дан Gurch 27 November 2019 в 02:10
поделиться

У Аарона Сконнарда из PluralSight есть куча замечательных небольших скринкастов на Channel9, и это, вероятно, лучшее вступление, которое я когда-либо видел - вам, вероятно, будет хорошо, если вы сначала получите некоторый опыт WCF мир SOAP воспримет это проще.

http://channel9.msdn.com/shows/Endpoint/endpointtv-Screencast-Building-RESTful-Services-with-WCF/

Также вставьте это в Bing

спокойный сайт: msdn.com

ОБНОВЛЕНИЕ

Этот ответ все еще получает голоса, поэтому я подумал, что было бы неплохо обновить его, добавив последние изменения. По сути, команда WCF объединила усилия с сообществом ASP.NET MVC, чтобы перенести REST в стек Microsoft через веб-API ASP.NET MVC 4, поэтому я полагаю, что с 2012 года материал WCF REST разрабатываться не будет.

http : //wcf.codeplex.com/wikipage? title = WCF% 20Web% 20API% 20is% 20now% 20ASP.

15
ответ дан 27 November 2019 в 02:10
поделиться
Другие вопросы по тегам:

Похожие вопросы: