На этот вопрос уже есть ответ:
Я работаю над проектом, который будет включать синтаксический анализ HTML.
После поиска я нашел два возможных варианта: BeautifulSoup и lxml.html
Есть ли причина предпочесть одно другому? Некоторое время назад я использовал lxml для XML и чувствую, что мне будет удобнее с ним, однако BeautifulSoup, похоже, очень распространен.
Я знаю, что должен использовать тот, который мне подходит, но я искал личного опыта с обоими.