как программно войти в Yahoo с сервера ubuntu

Я хотел бы войти в свою учетную запись Yahoo из сценария, работающего на сервере Ubuntu. Я пытался использовать python с механизацией, но в моем плане есть недостаток.

Это код, который у меня есть на данный момент.

        loginurl = "https://login.yahoo.com/config/login"
        br = mechanize.Browser()
        cj = cookielib.LWPCookieJar()
        br.set_cookiejar(cj)
        br.set_handle_equiv(True)
        br.set_handle_gzip(True)
        br.set_handle_redirect(True)
        br.set_handle_referer(True)
        br.set_handle_robots(False)
        br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)
        br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
        r = br.open(loginurl)
        html = r.read()
        br.select_form(nr=0)
        br.form['login']='[mylogin]'
        br.form['passwd']='[mypassword]'
        br.submit()

        print br.response().read()

В ответ я получаю страницу входа в Yahoo с жирным красным текстом. «В вашем браузере должен быть включен Javascript» или что-то подобное. В документах по механизации есть раздел, в котором упоминаются страницы, создающие файлы cookie с помощью JS, но, увы, страница справки возвращает HTTP 400 (, просто мне повезло )

. Выяснение того, что делает javascript, а затем выполнение этого вручную звучит как очень сложная задача. Я был бы готов переключиться на любой инструмент / язык, если он может работать на сервере Ubuntu. Даже если это означает использование другого инструмента для входа в систему, а затем передачу файла cookie для входа в мой скрипт Python. Любая помощь/совет приветствуется.

Обновление:

  • Я не хочу использовать API Yahoo

  • Я также пробовал использовать scrapy, но думаю, возникает та же проблема

. Мой скрап-скрипт

class YahooSpider(BaseSpider):
name = "yahoo"
start_urls = [
    "https://login.yahoo.com/config/login?.intl=us&.lang=en-US&.partner=&.last=&.src=&.pd=_ver%3D0%26c%3D%26ivt%3D%26sg%3D&pkg=&stepid=&.done=http%3a//my.yahoo.com"
]

def parse(self, response):
    x = HtmlXPathSelector(response)
    print x.select("//input/@value").extract()
    return [FormRequest.from_response(response,
                formdata={'login': '[my username]', 'passwd': '[mypassword]'},
                callback=self.after_login)]

def after_login(self, response):
    # check login succeed before going on
    if response.url == 'http://my.yahoo.com':
        return Request("[where i want to go next]",
                  callback=self.next_page, errback=self.error, dont_filter=True)
    else:
        print response.url
        self.log("Login failed.", level=log.CRITICAL)

def next_page(sekf, response):
    x = HtmlXPathSelector(response)
    print x.select("//title/text()").extract()

Скрап-скрипт просто выводит "https://login.yahoo.com/config/login"...... бу

7
задан kevlar1818 29 August 2012 в 17:35
поделиться