Я использую HtmlAgilityPack. Существует ли один линейный код, что я могу получить весь внутренний текст HTML, например, удалить все теги HTML и сценарии?
Вот так:
document.DocumentNode.InnerText
Обратите внимание, что это вернет текстовое содержимое тегов .
Чтобы исправить это, вы можете удалить все теги , например, так:
foreach(var script in doc.DocumentNode.Descendants("script").ToArray())
script.Remove();
foreach(var style in doc.DocumentNode.Descendants("style").ToArray())
style.Remove();