Каков лучший алгоритм стемминга “под ключ”? [закрытый]

Если ваш определенный список находится или может быть помещен в таблицу, вы можете сделать следующее:

SELECT 
   *
FROM [employeeName] Where dept In (Select dept From #tbl)
7
задан dicroce 22 October 2008 в 16:05
поделиться

2 ответа

Стеммер Porter2 является тем, с которым я решил пойти. Казалось, что стеммер носильщика был стандартом, но когда я нашел страницу автором, он рекомендовал "Снежок (Porter2)" стеммер. На этой странице существует канал порта C.

8
ответ дан 7 December 2019 в 01:28
поделиться

Это действительно зависит от того, как Вы планируете применить его. Инструментарий естественного языка (http://nltk.sourceforge.net) имеет много стеммеров, реализованных в нем, который должен смочь обработать большинство приложений. Я предпочитаю стеммер Morphy.

Конечно, это доступно в Python, поэтому если Вы работаете с другим языком, можно всегда просматривать код, чтобы подобрать алгоритм и передать его предпочтительному языку. Python очень читаем.

2
ответ дан 7 December 2019 в 01:28
поделиться
Другие вопросы по тегам:

Похожие вопросы: