Πώς μπορώ να εξαγάγω κείμενο από όλες τις σελίδες ενός MediaWiki;

Έχω τρέξει ένα MediaWiki που αντιπροσωπεύει ένα λεξικό γερμανικών όρων και τη μετάφρασή τους σε μια τοπική διάλεκτο. Κάθε σελίδα περιέχει έναν όρο, τη μετάφρασή του και μια σειρά πρόσθετων πληροφοριών.

Τώρα, για μια εκτυπώσιμη έκδοση του λεξικού, χρειάζομαι μια πλήρη εξαγωγή όλων των όρων και τη μετάφρασή τους. Δεδομένου ότι πρόκειται για απόσπασμα του περιεχομένου μιας σελίδας, υποθέτω ότι χρειάζομαι μια πλήρη εξαγωγή όλων των σελίδων στη νεότερη έκδοσή τους σε αναλύσιμη μορφή, π.χ. xml ή csv.

Κάποιος το έχει κάνει ή μπορεί να με οδηγήσει σε ένα εργαλείο; Πρέπει να αναφέρω ότι δεν έχω πλήρη πρόσβαση στον διακομιστή, π.χ. χωρίς γραμμή εντολών, αλλά μπορώ να προσθέσω επεκτάσεις MediaWiki ή να αποκτήσω πρόσβαση στη βάση δεδομένων MySQL.

13
задан svick 20 March 2014 в 12:46
поделиться