Как ползать по сайту/извлекать данные в базу данных с помощью python?

Я хотел бы создать веб-приложение, которое поможет другим студентам моего университета создавать свои расписания. Для этого мне нужно загрузить основные расписания (одна огромная html-страница), а также ссылку на подробное описание каждого курса в базу данных, желательно на python. Кроме того, мне нужно войти в систему, чтобы получить доступ к данным.

  • Как это сделать?
  • Какие инструменты/библиотеки я могу/должен использовать?
  • Есть ли хорошие учебники по этому вопросу?
  • Как мне лучше всего работать с двоичными данными (например, в формате pdf)?
  • Есть ли уже хорошие решения для этого?
11
задан McEnroe 1 December 2011 в 01:51
поделиться