Я могу использовать Пакет Гибкости HTML Для Парсинга Фрагмента HTML?

Question

Я могу использовать Пакет Гибкости HTML Для Парсинга Фрагмента HTML?

Гибкость HTML может Упаковать использоваться для парсинга строкового фрагмента HTML?

Такой как:

var fragment = "<b>Some code </b>";

Затем извлеките все <b> теги? Все примеры я замеченный до сих пор загружался как документы HTML.

7

c# .net html-agility-pack

задан ΩmegaMan 7 March 2019 в 15:59

2 ответа

Я не думаю, что это действительно лучшее использование HtmlAgilityPack.

Обычно я вижу людей, пытающихся анализировать большие объемы HTML с помощью регулярных выражений, и я указываю им на HtmlAgilityPack, но в этом случае я думаю, что было бы лучше использовать регулярное выражение.

У Роя Ошерова есть сообщение в блоге, в котором описывается, как можно вырезать весь HTML-код из сниппета:

http://weblogs.asp.net/rosherove/archive/2003/05/13/6963.aspx

Даже если вы получили правильный xpath с образцом Мики Колари, это будет работать только для фрагмента с тегом в нем и сломается, если код изменится.

2

ответ дан 6 December 2019 в 23:04
поделиться

Другие вопросы по тегам:
c# .net html-agility-pack

Похожие вопросы:

295
Скрытые возможности C #? [закрыто] - 25 September 2017 20:53

115
Какие ваши любимые методы расширения для C #? (Codeplex.com/extensionoverflow) - 23 May 2017 12:18

110
[Закрываются] любимые сочетания клавиш Visual Studio - 8 December 2013 19:31

81
Использование ключевого слова var в C # - 3 February 2015 03:25

51
Почему это считают плохой практикой для исключения фигурных скобок? [закрытый] - 19 August 2016 17:07

48
Что такое худшая ошибка в C # или .NET? [закрыто] - 13 August 2015 04:30

score 9 · Accepted Answer

Если это html, то да.

string str = "<b>Some code</b>";
// not sure if needed
string html = string.Format("<html><head></head><body>{0}</body></html>", str);
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);

// look xpath tutorials for how to select elements
// select 1st <b> element
HtmlNode bNode = doc.DocumentNode.SelectSingleNode("b[1]");
string boldText = bNode.InnerText;