Пехлеви Lucene и Java, Lucene создаются в PHP и Java repectively и языке PHP, имеет более высокий уровень, чем Java.
Просто задавшись вопросом, Как большой различие в производительности среди этих двух, относительно индексировать здание и поиск данных?
Действительно ли намного более эффективно позволить Java создать и восстановить индекс и позволить php использовать индекс?
Это цитата сертифицированного инженера Zend.
Вопреки моему здравому смыслу, компания, в которой я работаю, перенесла нашу предыдущее поисковое решение для Zend_Search_Lucene. На довольно сверхмощное оборудование, индексирование миллион документов занял несколько часов, и поиски были относительно медленными. В процесс индексации потреблял огромные суммы памяти, а индексы часто испортились (с использованием 1.5.2). А поиск по одиночному шаблону буквально поставил веб-сервер на колени, поэтому мы отключили эту функцию. объем памяти использование было очень высоким для поиска, и в результате запросов в секунду обязательно сильно снизился, как и у нас чтобы уменьшить количество дочерних Apache процессы.
С тех пор мы переехали в Solr (a Поисковый сервер Java на основе Lucene) и разница разительная. Индексирование сейчас занимает около 10 минут и поиски происходят молниеносно. Что за разница, которую имеет язык.
В данном случае Java.
Когда я задал этот вопрос евангелисту Zend и одному из их нанятых специалистов, мне сказали, что Java Lucene обеспечит существенно лучшую производительность. Их основные моменты касались обработки символов UTF8 и скорости индексации (если я правильно помню). Судя по всему, Java Lucene в этом намного лучше.