Эй, я бы хотел очистить некоторые данные из моего блога с помощью YQL:
SELECT * FROM html WHERE url="http://site.com/blog" AND xpath="//div[@class='post']"
Как я могу использовать разные биты xpath в моем запросе? Например, могу я сделать что-нибудь вроде:
SELECT * FROM html WHERE url="http://site.com/blog" AND xpath="//div[@class='post']" AND xpath ="//div[@class='title']"
, предполагая, что я хочу получить сообщение и заголовок? Думаю, я мог бы принять весь HTML, но я бы предпочел взять только то, что мне нужно, поскольку скорость здесь является проблемой.
Когда у меня есть HTML-код, который я хочу извлечь из разметки, можно ли использовать для этого регулярные выражения PHP?
Я также понимаю, что вы можете использовать синтаксис CSS, если у вас есть опыт использования этого с YQL и может помочь мне написать запрос, аналогичный приведенному выше, но с использованием CSS, а не XPATH, я был бы признателен!
Спасибо.