أريد أن أقوم ببعض عمليات تجريف الشاشة باستخدام Python 2.7 ، وليس لدي سياق للاختلافات بين HTMLParser
، SGMLParser
، أو شوربة جميلة.
هل يحاول هؤلاء جميعًا حل المشكلة نفسها أم أنهم موجودون لأسباب مختلفة؟ أيهما أبسط ، أيهما أقوى ، وأيهما (إن وجد) هو الخيار الافتراضي؟
أيضًا ، يرجى إعلامي إذا كنت قد أغفلت خيارًا مهمًا.
تعديل: يجب أن أذكر أنني لست متمرسًا بشكل خاص في تحليل HTML ، وأنا مهتم بشكل خاص بما سيحصل علي التحرك بشكل أسرع بهدف تحليل HTML على موقع معين.