Каковы самые быстрые алгоритмы/API полнотекстового поиска (открытый исходный код или коммерческий)?

Есть ли какие-либо серебряные пули там для поиска объемов среднего размера текстовых данных (сотни гигабайтов)? Действительно не заботьтесь, является ли это коммерческим или с открытым исходным кодом. Я должен добавить, что мне нужен он, чтобы быть C++ или базирующимся C.

5
задан Leeks and Leaks 21 February 2010 в 19:37
поделиться

2 ответа

Apache Lucene - это широко используемый механизм индексирования, не уверен, что он квалифицируется как серебряная пуля или нет. Я видел его в сочетании с Carrot2 для кластеризации и поиска в индексе.

3
ответ дан 15 December 2019 в 00:59
поделиться

Также есть xapian .

1
ответ дан 15 December 2019 в 00:59
поделиться
Другие вопросы по тегам:

Похожие вопросы: