تحليل HTML مع Python 2.7 - HTMLParser أو SGMLParser أو Beautiful Soup؟

أريد أن أقوم ببعض عمليات تجريف الشاشة باستخدام Python 2.7 ، وليس لدي سياق للاختلافات بين HTMLParser ، SGMLParser ، أو شوربة جميلة.

هل يحاول هؤلاء جميعًا حل المشكلة نفسها أم أنهم موجودون لأسباب مختلفة؟ أيهما أبسط ، أيهما أقوى ، وأيهما (إن وجد) هو الخيار الافتراضي؟

أيضًا ، يرجى إعلامي إذا كنت قد أغفلت خيارًا مهمًا.

تعديل: يجب أن أذكر أنني لست متمرسًا بشكل خاص في تحليل HTML ، وأنا مهتم بشكل خاص بما سيحصل علي التحرك بشكل أسرع بهدف تحليل HTML على موقع معين.

16
задан Eric Wilson 27 June 2011 в 14:53
поделиться