У меня есть веб-страница, с которой мне нужно соскоблить некоторые данные. Проблема в том, что на каждой странице могут быть или не быть определенные данные, или она может иметь дополнительные данные выше или ниже в DOM, и нет никаких CSS id, чтобы говорить об этом.
Обычно я могу использовать либо CSS-идентификаторы, либо XPath, чтобы добраться до нужного мне узла. В данном случае у меня нет такой возможности. Я пытаюсь найти текст "label", а затем взять данные в следующем В приведенном выше HTML я бы искал: чтобы получить узел непосредственно перед нужными мне данными, но я не уверен, как перейти оттуда. узле:
<tr>
<td><b>Name:</b></td>
<td>Joe Smith <small><a href="/Joe"><img src="/joe.png"></a></small></td>
</tr>
doc.search("[text()*='Name:']")
0 ответов
Похожие вопросы: