Какой Open Source Crawler лучше?

Я сравниваю эти четыре Nutch / Heritrix / OpenPipeLine / Apache Tika. Какой из них лучше? Каковы достоинства и недостатки каждого из них? Я хотел бы иметь расширяемый краулер, который может просматривать список веб-сайтов и может быть изменен при необходимости.

5
задан Riz 7 December 2011 в 13:28
поделиться