На странице Википедии, такой как Wikipedia: Stack Overflow , часто есть информационные блоки (в основном справа вверху страницы). Пример снимка экрана:
DBPedia перечисляет все эти атрибуты как тройки RDF. Вы можете увидеть пример на DBPedia: Stack Overflow . Там вы видите интересное свойство dbpprop: wikiPageUsesTemplate
со значением dbpedia: Template: Infobox_website
. Я хочу знать, на каких страницах Википедии используется этот шаблон. Как я могу это сделать и перечислить все страницы, которые используют шаблон Infobox_website? Желательно с запросом SPARQL, но я открыт для других простых решений.
Далее следует список всех шаблонов Infobox. Википедия: Шаблоны информационного окна категорий показывает иерархию желаемых категорий Википедии - это похоже на то, что я ищу. Но я хочу, чтобы все это было в машиночитаемом формате на одной странице. Может быть, DBPedia и здесь подходит? В DBPedia: Шаблоны информации о категориях и DBPedia: INFOBOX я нахожу очень мало информации. Но они выглядят очень многообещающими. Как я могу использовать SPARQL для поиска всех типов Infobox, чтобы я мог повторно выполнять шаг 1 для каждого из них?
Вы можете использовать это для тестирования запросов SPARQL: http: // dbpedia.org / snorql /
Кажется, я решил проблему №1: SPARQL: перечислить все страницы с помощью Infobox_website
Кроме того, это похоже на запрос номера проблемы 2: SPARQL: список всех информационных ящиков