10
ответов

Как повернуть множественные исключительные слова?

Я готовлю некоторые имена таблиц к ORM, и я хочу превратить множественные имена таблиц на единственные имена объекта. Моя единственная проблема находит алгоритм, который делает это надежно. Вот то, что я делаю правильно...
вопрос задан: 29 July 2009 10:32
8
ответов

Как я делаю выделение основы слова или Лемматизацию?

Я попробовал PorterStemmer и Снежок, но оба не работают над всеми словами, пропуская некоторые очень общие. Мои тестовые слова: "выполнение кошек выполнило сообщества сообщества кактусов кактусов кактуса", и оба добираются...
вопрос задан: 23 May 2017 11:55
6
ответов

NLTK word Lemmatizer странное поведение - помощь в пометке POS - Python 3 [дубликат]

Пытался написать небольшую программу анализа настроений в python3. Но, работая со словом lemmatizer, увидел, что странное преобразование «было» в «wa» было совершенно неожиданным. Ниже приведено мое ...
вопрос задан: 23 March 2013 14:23
6
ответов

Можно ли программно обнаружить плюрализацию английских слов и получить ли форму единственного числа?

Учитывая некоторое (английское) слово, которое мы примем, множественное число, действительно ли возможно получить форму единственного числа? Я хотел бы избежать таблиц поиска/словаря, если это возможно. Некоторые примеры: Примеры-> Пример...
вопрос задан: 30 June 2012 04:57
3
ответа

каково истинное различие между лемматизацией по сравнению со стеммингом?

Когда я использую каждого? Также... действительно ли лемматизация NLTK зависит от Частей речи? Разве не было бы более правильно, если бы это было?
вопрос задан: 24 November 2009 00:48
1
ответ

OpenNLP: невозможно найти файл модели для Lemmatizer

Описание: Невозможно найти файл модели, используемый для Lemmatizer (english-lemmatizer.txt / english-lemmatizer.bin) Подробности: Модели инструментов OpenNLP, по-видимому, представляют собой всеобъемлющее хранилище для различных ...
вопрос задан: 28 March 2019 06:08
0
ответов

Анализировать текст (лемматизация, редактировать расстояние)

Мне нужно проанализировать текст на наличие в нем запрещенных слов. Допустим, в черном списке есть слово: «Запретить». Слово имеет много форм. В тексте слово может быть, например: «запрещающий», «запрещенный», «...
вопрос задан: 7 July 2019 14:27
0
ответов

Создание лемматизатора: оптимизация скорости

Я создаю лемматизатор на питоне. Поскольку мне нужно, чтобы он работал в реальном времени/обрабатывал довольно большой объем данных, скорость обработки имеет существенное значение. Данные: у меня есть все возможные суффиксы, которые связаны с ...
вопрос задан: 23 March 2012 17:42
0
ответов

Эффективный лемматизатор, который избегает поиска в словаре

Я хочу преобразовать строку типа «есть» в «есть», «ест». Я искал и нашел лемматизацию как решение, но все инструменты лемматизатора, с которыми я сталкивался, используют список слов или поиск по словарю ....
вопрос задан: 12 December 2011 09:03