Αναλύω πολλούς ιστότοπους. Όλα λειτουργούν καλά, διαβάζω επίσης δηλώσεις χαρακτήρων για μετατροπή κωδικοποιήσεων. Τώρα έχω πρόβλημα με το http://celleheute.de/sonntagsfuhrung-3/ .
Η μετα-ετικέτα HTML λέει, ότι το περιεχόμενο έχει κωδικοποιηθεί ως ISO-8859-2, αλλά το HTTP η κεφαλίδα λέει, είναι UTF-8. Και πραγματικά, το περιεχόμενο είναι κωδικοποιημένο UTF, οπότε όταν ο αναλυτής μου προσπαθεί να μετατρέψει το περιεχόμενο σε ISO, θα σπάσει μερικούς χαρακτήρες.
Τώρα η ερώτησή μου είναι, ποια δήλωση πρέπει να προτιμώ; Πρέπει να αγνοήσω τις μετα-ετικέτες, όταν μπορώ να βρω τη δήλωση στην κεφαλίδα HTTP ή αντίστροφα; Τι θα κάνουν τα περισσότερα προγράμματα περιήγησης ιστού;