Я был в процессе написания сценария синтаксического анализатора Python для RSS-каналов. Я использую feedparser, однако я застрял на синтаксическом анализе каналов из FeedBurner. Кому сейчас нужен FeedBurner? В любом случае ..
Например, я не смог найти способ разобрать
http://feeds.wired.com/wired/index
http://feeds2.feedburner.com/ziffdavis/pcmag
Когда я помещаю их в библиотеку feedparser, похоже, что они не работают. Пытался поместить? Fmt = xml или? Format = xml в конце URL-адресов, но все еще не получил формат xml.
Нужно ли мне использовать html-синтаксический анализатор, такой как BeautifulSoup, для синтаксического анализа каналов FeedBurner? Желательно, чтобы существовал публичный парсер или скрипт агрегатора Python, который уже справляется с этим?
Мы будем очень благодарны за любые советы или помощь.