Пакет гибкости HTML

Я пытаюсь использовать Пакет Гибкости HTML для получения текста описания изнутри:

<meta name="description" content="**this is the text i want to extract and store in a string**" />

И кто-то на Stackoverflow только что предложил, чтобы я использовал HTMLAgilityPack. Но я не знаю, как использовать его, и документация для него, что я нашел (включая документы, содержавшиеся в загрузках), все имеют недопустимые ссылки и для этого не могут просмотреть документацию.

Кто-то может помочь мне решить это?

11
задан jay_t55 10 December 2009 в 21:39
поделиться

1 ответ

Использование очень похоже на XmlDocument ; вы можете использовать MSDN в XmlDocument для широкого обзора; вы также можете изучить синтаксис xpath ( MSDN ).

Пример:

HtmlDocument doc = new HtmlDocument();
doc.Load(path); // or .LoadHtml(html);
HtmlNode node = doc.DocumentNode.SelectSingleNode("//meta[@name='description']");
if (node != null) {
    string desc = node.GetAttributeValue("content", "");
    // TODO: write desc somewhere
}

Второй аргумент GetAttributeValue - это значение по умолчанию, возвращаемое в случае, если атрибут не найден.

18
ответ дан 3 December 2019 в 06:46
поделиться
Другие вопросы по тегам:

Похожие вопросы: