Я делаю исследовательский проект в течение лета, и я должен использовать, получают некоторые данные из Википедии, хранят его и затем делают некоторый анализ его. Я использую API Википедии для сбора данных, и у меня есть это вниз вполне прилично.
Что мои вопросы в отношении links-alllinks
опция в документе API здесь После чтения описания, и там и в самом API (это снижается и является битом и я не могу связаться непосредственно с разделом), я думаю, что понимаю то, что это, как предполагается, возвращает. Однако, когда я выполнил запрос, он дал мне назад что-то, что я не ожидал.
Вот запрос, который я выполнил:
http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=google&rvprop=ids|timestamp|user|comment|content&rvlimit=1&list=alllinks&alunique&allimit=40&format=xml
Который в сущности говорит: Получите последний пересмотр страницы Google, включайте идентификатор, метку времени, пользователя, комментарий и содержание каждого пересмотра, и возвратите его в формате XML. allinks (я думал), должен дать мне назад список страниц Википедии, которые указывают на страницу Google (В этом случае первые 40 уникальных).
Я не уверен, что идет политика, клянется, но это - результат, который я возвратил точно:
часть, ее просто загрузка случайной напыщенности речи и оскорбительных комментариев. Нет почти, что я думал, что доберусь. Я сделал маленький поиск, но я, может казаться, не нахожу прямой ответ на свой вопрос.
list=alllinks
возврат опции?Вам не нужен список; список - это то, что проходит по всем страницам . В вашем случае вы просто «перечисляете все ссылки, которые указывают на заданное пространство имен».
Вы хотите, чтобы свойство было связано со страницей Google, поэтому вам нужно prop = links вместо чуши alllinks.
Итак, ваш запрос выглядит так:
http://en.wikipedia.org/w/api.php?action=query&prop=revisions|links&titles=google&rvprop=ids|timestamp|user|comment|content&rvlimit=1&format=xml