Python/веб-скрапинг/aspx — возможно ли это по-человечески, когда нет форм?

Полный нуб, очевидно. Самостоятельное обучение Python для парсинга веб-страниц в интересах открытых записей/прозрачности правительства/отчетности и т. д.

Есть страница.aspx, которую я хочу очистить, неделя -по -недельному календарю на январь -март 2012

Но на ней нет форм...

Возможно, вы, добрые люди, сможете скажите мне, возможно ли решение, прежде чем я потрачу дни на борьбу с ним.

http://webmail.legis.ga.gov/Calendar/default.aspx?chamber=house

Единственный способ увидеть встречи в календаре — это выбрать день на изображении календаря. Но, по крайней мере, если вы нажмете на понедельник, он покажет все встречи на неделю. (Я хотел бы собрать все эти назначения, чтобы подсчитать, как часто собирается каждый комитет, что-то вроде прокси для подсчета того, какой закон привлекает внимание, а какой игнорируется.)

Итак, какую же стратегию использовать? Похоже, что каждому месяцу, по крайней мере в его недрах, присваивается последовательное четырехзначное число -с предшествующей буквой «V», например V4414, и дням с числом без префикса -.

Охочусь только янв -март 2012; другие месяцы -неуместны и в основном пусты.

подсказка?

   ...FebruaryMarch 2012April 

образец?

   ...262728...

Удачи и спасибо!!

5
задан greencracker 4 May 2012 в 03:09
поделиться