Как получить данные Infobox из Википедии?

Если бы у меня есть URL к странице, как я получил бы информацию о Infobox об использовании права веб-сервисы MediaWiki?

18
задан Termininja 9 December 2016 в 19:37
поделиться

4 ответа

Нет тривиального способа сделать это. Вы можете попробовать получить содержимое страницы, используя action = raw , то есть http://en.wikipedia.org/w/index.php?action=raw&title=Douglas_Jardine Затем найдите начало информационного окна, выполнив поиск по запросу {{Информационное окно . Затем найдите конец, найдя соответствие }} , учитывая, что само информационное окно также может содержать {{ - }} и {{ { - }}} пары.

11
ответ дан 30 November 2019 в 06:42
поделиться

Tomxu - то, о чем вы говорите, это шаблон - это простая страница, которую можно включить в другую страницу. Для инфобокса вам нужно начать с Шаблон:Инфобокс. Здесь даны подробные инструкции.

Вы также можете нажать кнопку редактировать (или просмотреть код) и скопировать содержимое в свою вики. Имейте в виду, что шаблоны обычно располагаются в иерархии, поэтому вам может понадобиться скопировать другие шаблоны, которые использует Infobox (если вы хотите их использовать). Каждый шаблон может быть идентифицирован с помощью {{}}, поэтому, например, шаблон Infobox будет выглядеть следующим образом: {{Infobox}}.

Я упомянул иерархию: на самом деле вы найдете несколько шаблонов, которые все используют Template: Infobox. Чтобы найти их, просто введите в поле поиска Википедии следующее: Шаблон:Infobox и тогда вы найдете множество примеров, например, Шаблон:Infobox writer

Update: если вы имеете в виду Navbox'ы, то смотрите эту информацию.

1
ответ дан 30 November 2019 в 06:42
поделиться

В нашем проекте мы используем запросы для извлечения данных из викисловаря следующим образом:

http://query.yahooapis.com/v1/public/yql?q=select%20*%20from%20html%20where%20url%3D%22http%3A%2F%2Fen.wiktionary.org%2Fwiki%2Flife%22%20and%20xpath%3D'%2F%2Fdiv%5B%40id%3D%22bodyContent%22%5D'&format=xml&diagnostics=false&env=store%3A%2F%2Fdatatables.org%2Falltableswithkeys&callback=recwiki

Я не имею полного представления об этом, но это работает. Выходной результат можно отфильтровать с помощью jquery или чего-то еще.

0
ответ дан 30 November 2019 в 06:42
поделиться

Если вы просто хотите проанализировать информационное окно или получить обработанные данные, посмотрите проект DBPedia: http://dbpedia.org

Он сканирует infoboxes в WP для создания базы данных RDF из Википедии: https://github.com/dbpedia/extraction-framework/

14
ответ дан 30 November 2019 в 06:42
поделиться
Другие вопросы по тегам:

Похожие вопросы: