спойлер:
Это просто еще один Люцен против Сфинкса против чего угодно,
Я увидел, что всем остальным потокам уже почти два года, поэтому решил начать заново ..
Вот требование:
размер данных: не более 10 ГБ.
строк: почти миллиарды
индексация должна быть быстрой
поиск должен быть менее 0 мс [хорошо, шутка ... смейтесь ... но старайтесь сохранить это значение как можно меньше]
Что / что / как мне делать в современном мире?
редактировать:
Я немного рассчитал время на lucene, и для индексации данных объемом 1,8 ГБ потребовалось 5 минут.
поиск выполняется довольно быстро, если я не наберу a * . a * занимает 400 ~ 500 мс.
My biggest worry is indexing, which is taking loooonnnnggg time, and lot of resources!!