Я пытаюсь использовать Пакет Гибкости HTML для получения текста описания изнутри:
<meta name="description" content="**this is the text i want to extract and store in a string**" />
И кто-то на Stackoverflow только что предложил, чтобы я использовал HTMLAgilityPack. Но я не знаю, как использовать его, и документация для него, что я нашел (включая документы, содержавшиеся в загрузках), все имеют недопустимые ссылки и для этого не могут просмотреть документацию.
Кто-то может помочь мне решить это?
Использование очень похоже на XmlDocument
; вы можете использовать MSDN в XmlDocument
для широкого обзора; вы также можете изучить синтаксис xpath ( MSDN ).
Пример:
HtmlDocument doc = new HtmlDocument();
doc.Load(path); // or .LoadHtml(html);
HtmlNode node = doc.DocumentNode.SelectSingleNode("//meta[@name='description']");
if (node != null) {
string desc = node.GetAttributeValue("content", "");
// TODO: write desc somewhere
}
Второй аргумент GetAttributeValue
- это значение по умолчанию, возвращаемое в случае, если атрибут не найден.