Есть идеи, как определить основное содержание страницы?

, что бы вы сделали, если бы вам нужно было идентифицировать основной текст страницы (например, на странице блога, чтобы идентифицировать содержание сообщения)? Как вы думаете, как это сделать проще всего?

  1. Получить содержимое страницы с помощью cURL
  2. Возможно, использовать парсер DOM для идентификации элементов страницы
8
задан Anony-Mousse 5 August 2012 в 05:52
поделиться