Кто-либо проанализировал Wiktionary? [закрытый]

32
задан Nemo 13 February 2016 в 20:22
поделиться

2 ответа

Викисловарь работает на MediaWiki, который имеет API .

Одна из подстраниц документации API - это Клиентский код, в котором перечислены некоторые библиотеки Python .

20
ответ дан 27 November 2019 в 20:02
поделиться

Одно время я скачал дамп викисловаря, пытаясь собрать воедино слова и определения для славянских языков. Я подошел к нему, используя elementtree, чтобы пройти через XML-файл, который является дампом. Я бы не стал пытаться очистить или сканировать сайт, а просто загрузил бы XML-дамп, который Викимедиа предоставляет для викисловаря. Зайдите на загрузку Викимедиа , найдите английские дампы викисловаря ( enwiktionary ) и перейдите к самому последнему дампу. Возможно, вам понадобится файл pages-article.xml.bz2, который представляет собой просто содержание статьи, без истории или комментариев. Разберите это с любыми библиотеками обработки xml, которые вы предпочитаете в python. Я лично предпочитаю elementtree. Удачи.

23
ответ дан 27 November 2019 в 20:02
поделиться
Другие вопросы по тегам:

Похожие вопросы: