Выборка выборки из статьи Wikipedia?

Я был вверх и вниз по API Википедии, но я не могу выяснить, существует ли хороший способ выбрать выборку статьи (обычно первый абзац). Было бы хорошо получить форматирование HTML того абзаца, также.

Единственным путем я в настоящее время вижу получения чего-то, что напоминает отрывок, путем выполнения полнотекстового поиска (пример), но это не действительно, что я хочу (слишком короткий).

Там какой-либо другой путь состоит в том, чтобы выбрать первый абзац статьи Wikipedia, чем варварский парсинг HTML/WikiText?

11
задан Damjan Pavlica 18 October 2015 в 17:31
поделиться

1 ответ

Я не нашел способа сделать это через API, поэтому я прибег к синтаксическому анализу HTML, используя функции PHP DOM . Это было довольно просто, что-то среди строк:

$doc = new DOMDocument();
$doc->loadHTML($wikiPage);
$xpath = new DOMXpath($doc);
$nlPNodes = $xpath->query('//div[@id="bodyContent"]/p');
$nFirstP = $nlPNodes->item(0);
$sFirstP = $doc->saveXML($nFirstP);
echo $sFirstP; // echo the first paragraph of the wiki article, including <p></p>
3
ответ дан 3 December 2019 в 08:28
поделиться
Другие вопросы по тегам:

Похожие вопросы: