Нужна помощь по очистке экрана с помощью анемона и nokogiri

У меня есть стартовая страница http://www.example.com/startpage , который содержит 1220 списков, разбитых на страницы стандартным способом, например, 20 результатов на страницу.

У меня есть рабочий код, который анализирует первую страницу результатов и переходит по ссылкам, которые содержат «example_guide / paris_shops» в своих URL. Затем я использую Nokogiri для извлечения конкретных данных с этой последней страницы. Все работает хорошо, и 20 результатов записываются в файл.

Однако я не могу понять, как заставить Anemone сканировать следующую страницу результатов (http://www.example.com/startpage ? page = 2), а затем продолжить синтаксический анализ этой страницы, а затем третьей страницы (http://www.example.com/startpage?page=3) и т. д.

Итак, я хотел бы спросить, есть ли у кого-нибудь знает, как я могу заставить анемона запускаться на странице, анализировать все ссылки на этой странице (и следующий уровень данных для конкретных данных), но затем следовать разбиению на страницы на следующую страницу результатов, чтобы анемон снова мог начать синтаксический анализ и т. д. и дальше. Учитывая, что ссылки для пагинации отличаются от ссылок в результатах, Anemone, конечно, не следует по ним.

В настоящий момент я загружаю URL-адрес для первой страницы результатов, позволяя ему закончить, а затем вставляю в следующий URL-адрес для второй страницы результатов и т.д. на основе свойства объекта У меня есть список MyObject ... MyObject {int id, String name}. Теперь я хочу разбить список на подсписки, которые имеют идентичные значения "id", может ли кто-нибудь предложить эффективный подход для этого.

У меня есть список MyObjects ... MyObject {int id, String name}. Теперь я хочу разбить список на подсписки с одинаковыми " но было бы неплохо не иметь задержки, когда пользователь фокусируется на вашем окне.

Спасибо!

8
задан joneath 1 October 2010 в 04:54
поделиться