Масштабируемость aho corasick

Я хочу выполнить поиск в текстовом документе вхождений ключевых фраз из базы данных ключевых фраз (извлеченных из заголовков статей в Википедии) (т. е. с учетом документ, я хочу узнать, есть ли у какой-либо из фраз соответствующая статья в Википедии) Я узнал об алгоритме Ахо-Корасика. Я хочу знать, является ли построение автомата Ахо-Корасика для словаря из миллионов статей эффективным и масштабируемым.

10
задан templatetypedef 24 December 2012 в 22:30
поделиться