Я могу использовать Пакет Гибкости HTML Для Парсинга Фрагмента HTML?

Гибкость HTML может Упаковать использоваться для парсинга строкового фрагмента HTML?

Такой как:

var fragment = "<b>Some code </b>";

Затем извлеките все <b> теги? Все примеры я замеченный до сих пор загружался как документы HTML.

7
задан ΩmegaMan 7 March 2019 в 15:59
поделиться

2 ответа

Если это html, то да.

string str = "<b>Some code</b>";
// not sure if needed
string html = string.Format("<html><head></head><body>{0}</body></html>", str);
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);

// look xpath tutorials for how to select elements
// select 1st <b> element
HtmlNode bNode = doc.DocumentNode.SelectSingleNode("b[1]");
string boldText = bNode.InnerText;
9
ответ дан 6 December 2019 в 23:04
поделиться

Я не думаю, что это действительно лучшее использование HtmlAgilityPack.

Обычно я вижу людей, пытающихся анализировать большие объемы HTML с помощью регулярных выражений, и я указываю им на HtmlAgilityPack, но в этом случае я думаю, что было бы лучше использовать регулярное выражение.

У Роя Ошерова есть сообщение в блоге, в котором описывается, как можно вырезать весь HTML-код из сниппета:

Даже если вы получили правильный xpath с образцом Мики Колари, это будет работать только для фрагмента с тегом в нем и сломается, если код изменится.

2
ответ дан 6 December 2019 в 23:04
поделиться
Другие вопросы по тегам:

Похожие вопросы: