Пример HTML:
<html><body>
<form id="form1">
<input name="foo1" value="bar1" />
<!-- Other elements -->
</form>
<form id="form2">
<input name="foo2" value="bar2" />
<!-- Other elements -->
</form>
</body></html>
Тестовый код:
HtmlDocument doc = new HtmlDocument();
doc.Load(@"D:\test.html");
foreach (HtmlNode node in doc.GetElementbyId("form2").SelectNodes(".//input"))
{
Console.WriteLine(node.Attributes["value"].Value);
}
Оператор doc.GetElementbyId("form2").SelectNodes(".//input")
дает мне нулевую ссылку.
Что-нибудь я сделал неправильно?спасибо.
Вы можете сделать следующее:
HtmlNode.ElementsFlags.Remove("form");
HtmlDocument doc = new HtmlDocument();
doc.Load(@"D:\test.html");
HtmlNode secondForm = doc.GetElementbyId("form2");
foreach (HtmlNode node in secondForm.Elements("input"))
{
HtmlAttribute valueAttribute = node.Attributes["value"];
if (valueAttribute != null)
{
Console.WriteLine(valueAttribute.Value);
}
}
По умолчанию HTML Agility Pack анализирует формы как пустой узел, поскольку им разрешено перекрывать другие элементы HTML. Первая строка ( HtmlNode.ElementsFlags.Remove ("form");
) отключает это поведение, позволяя вам получить входные элементы внутри второй формы.
Обновление: Пример перекрытия элементов формы:
<table>
<form>
<!-- Other elements -->
</table>
</form>
Элемент начинается внутри таблицы, но закрывается за пределами элемента таблицы. Это разрешено в спецификации HTML, и HTML Agility Pack должен с этим справиться.