веб-очистка, чтобы заполнить (и получить) ищет формы?

Microsoft SQL Server (T-SQL)

В select, используйте:

select case when Obsolete = 'N' or InStock = 'Y' then 'YES' else 'NO' end

В where пункт, используйте:

where 1 = case when Obsolete = 'N' or InStock = 'Y' then 1 else 0 end
6
задан hatmatrix 23 July 2009 в 07:11
поделиться

2 ответа

Beautiful Soup отлично подходит для анализа веб-страниц - это половина того, что вы хотите сделать. У Python, Perl и Ruby есть версия Mechanize, и это вторая половина:

http://wwwsearch.sourceforge.net/mechanize/

Mechanize позволяет вам управлять браузером:

# Follow a link
browser.follow_link(link_node)

# Submit a form
browser.select_form(name="search")
browser["authors"] = ["author #1", "author #2"]
browser["volume"] = "any"
search_response = br.submit()

С помощью Mechanize и Beautiful Soup у вас отличное начало. Еще один инструмент, который я бы рассмотрел, - это Firebug, который используется в этом кратком руководстве по очистке рубинов:

http://www.igvita.com/2007/02/04/ruby-screen-scraper-in-60-seconds/

Firebug может ускорить создание xpath для синтаксического анализа документов, сэкономив вам много времени.

Удачи!

net / Mechanize /

Mechanize позволяет вам управлять браузером:

# Follow a link
browser.follow_link(link_node)

# Submit a form
browser.select_form(name="search")
browser["authors"] = ["author #1", "author #2"]
browser["volume"] = "any"
search_response = br.submit()

С Mechanize и Beautiful Soup у вас отличное начало. Еще один инструмент, который я бы рассмотрел, - это Firebug, который используется в этом кратком руководстве по очистке рубинов:

http://www.igvita.com/2007/02/04/ruby-screen-scraper-in-60-seconds/

Firebug может ускорить создание xpath для синтаксического анализа документов, сэкономив вам много времени.

Удачи!

net / Mechanize /

Mechanize позволяет вам управлять браузером:

# Follow a link
browser.follow_link(link_node)

# Submit a form
browser.select_form(name="search")
browser["authors"] = ["author #1", "author #2"]
browser["volume"] = "any"
search_response = br.submit()

С Mechanize и Beautiful Soup у вас отличное начало. Еще один инструмент, который я бы рассмотрел, - это Firebug, который используется в этом кратком руководстве по очистке рубинов:

http://www.igvita.com/2007/02/04/ruby-screen-scraper-in-60-seconds/

Firebug может ускорить создание xpath для синтаксического анализа документов, сэкономив вам много времени.

Удачи!

9
ответ дан 9 December 2019 в 20:47
поделиться
WebRequest req = WebRequest.Create("http://www.URLacceptingPOSTparams.com");

req.Proxy = null;
req.Method = "POST";
req.ContentType = "application/x-www-form-urlencoded";

//
// add POST data
string reqString = "searchtextbox=webclient&searchmode=simple&OtherParam=???";
byte[] reqData = Encoding.UTF8.GetBytes (reqString);
req.ContentLength = reqData.Length;
//
// send request
using (Stream reqStream = req.GetRequestStream())
  reqStream.Write (reqData, 0, reqData.Length);

string response;
//
// retrieve response
using (WebResponse res = req.GetResponse())
using (Stream resSteam = res.GetResponseStream())
using (StreamReader sr = new StreamReader (resSteam))
  response = sr.ReadToEnd();

// use a regular expression to break apart response
// OR you could load the HTML response page as a DOM 

(Адаптировано из книги Джо Албахри "В двух словах о C #")

1
ответ дан 9 December 2019 в 20:47
поделиться
Другие вопросы по тегам:

Похожие вопросы: