Если бы у меня есть URL к странице, как я получил бы информацию о Infobox об использовании права веб-сервисы MediaWiki?
Нет тривиального способа сделать это. Вы можете попробовать получить содержимое страницы, используя action = raw
, то есть http://en.wikipedia.org/w/index.php?action=raw&title=Douglas_Jardine
Затем найдите начало информационного окна, выполнив поиск по запросу {{Информационное окно
. Затем найдите конец, найдя соответствие }}
, учитывая, что само информационное окно также может содержать {{
- }}
и {{ {
- }}}
пары.
Tomxu - то, о чем вы говорите, это шаблон - это простая страница, которую можно включить в другую страницу. Для инфобокса вам нужно начать с Шаблон:Инфобокс. Здесь даны подробные инструкции.
Вы также можете нажать кнопку редактировать (или просмотреть код) и скопировать содержимое в свою вики. Имейте в виду, что шаблоны обычно располагаются в иерархии, поэтому вам может понадобиться скопировать другие шаблоны, которые использует Infobox (если вы хотите их использовать). Каждый шаблон может быть идентифицирован с помощью {{}}, поэтому, например, шаблон Infobox будет выглядеть следующим образом: {{Infobox}}.
Я упомянул иерархию: на самом деле вы найдете несколько шаблонов, которые все используют Template: Infobox. Чтобы найти их, просто введите в поле поиска Википедии следующее: Шаблон:Infobox и тогда вы найдете множество примеров, например, Шаблон:Infobox writer
Update: если вы имеете в виду Navbox'ы, то смотрите эту информацию.
В нашем проекте мы используем запросы для извлечения данных из викисловаря следующим образом:
http://query.yahooapis.com/v1/public/yql?q=select%20*%20from%20html%20where%20url%3D%22http%3A%2F%2Fen.wiktionary.org%2Fwiki%2Flife%22%20and%20xpath%3D'%2F%2Fdiv%5B%40id%3D%22bodyContent%22%5D'&format=xml&diagnostics=false&env=store%3A%2F%2Fdatatables.org%2Falltableswithkeys&callback=recwiki
Я не имею полного представления об этом, но это работает. Выходной результат можно отфильтровать с помощью jquery или чего-то еще.
Если вы просто хотите проанализировать информационное окно или получить обработанные данные, посмотрите проект DBPedia: http://dbpedia.org
Он сканирует infoboxes в WP для создания базы данных RDF из Википедии: https://github.com/dbpedia/extraction-framework/