Есть ли способ получить тему предложения с помощью OpenNLP? Я пытаюсь выделить самую важную часть предложения пользователя. Как правило, пользователи будут отправлять предложения в наш «движок» и ...
Что представляет собой современное программное обеспечение для устранения неоднозначности слов (WSD)? Какие показатели определяют состояние дел и какие инструменты / пакеты с открытым исходным кодом доступны?
Я использовал ne_chunk NLTK для извлечения именованных сущностей из текста: my_sent = "ВАШИНГТОН - После ряда злоупотреблений со стороны нью-йоркских полицейских в 1990-х годах, Лоретта Э. Линч, высшая федеральная власть ...
Пример: Speak -> Spubeak, подробнее здесь Не давайте мне решения, но укажите мне правильное направление или скажите, какую библиотеку python я мог бы использовать? Я думаю о regex, так как я должен найти ...
Как с помощью NLTK и WordNet преобразовать глагол простого времени в формы причастия настоящего, прошедшего или прошедшего времени? Например: я хочу написать функцию, которая дала бы мне глагол в ожидаемой форме как ...
Мне нужно рассчитать оценку BLEU для определения того, похожи ли два предложения или нет. Я прочитал несколько статей, которые в основном посвящены оценке BLEU для измерительной машины точность перевода. Но я ...
Я пытаюсь придумать неявную проверку орфографии, которая будет использовать сопоставление входных слов с каким-то более общим фонетическим представлением для учета опечаток, которые могут возникнуть, в основном для...
Я пытаюсь создать общий идентификатор синонимов для слов в предложении, которые являются значимыми (т.е. не «a» или «the»), и я использую набор инструментов для естественного языка (nltk) в python для него. The ...
Я хотел бы найти способ разбить слово на слоги с помощью PHP. Например, слово «nevermore», пробежавшееся через detect_syllables (), вернет «nev-er-more». Есть ли хорошие API или ...
Каков наиболее эффективный способ получить прошедшее время глагола, желательно без использования фреймворков НЛП с тяжелым объемом памяти? например дожить до: дожить до: попробовать коснуться: постучать доварить до: сварить до продать: ...
Недавно я посетил курс на Coursera по теме «Обработка естественного языка» и много узнал о синтаксическом анализе, IR и других интересных аспектах, таких как вопросы и ответы и т. д., хотя я хорошо усвоил концепции, но…
Применение методов машинного обучения, в частности методов интеллектуального анализа текста, в среде браузера (в основном Javascript) или в качестве веб-приложения не является очень широко обсуждаемой темой. Я хочу ...
Привет, я пытаюсь использовать PET Parser, но документация предоставлено для использования недостаточно. Может ли кто-нибудь указать мне на хорошую статью или руководство по использованию ПЭТ? Поддерживает ли он utf-8?
Мне было поручено создать простую программу проверки орфографии для задания, но я почти не дал никаких указаний, поэтому мне было интересно, может ли кто-нибудь мне помочь. Я не ищу кого-то, кто выполнит задание для ...
Я хочу решить проблему разбиения слов (разбирать слова из длинной строки без пробелов).
Например, мы хотим извлечь слова из somelongword в [some, long, word]. Мы можем добиться этого с помощью некоторой динамической...
Как вы разбираете HTML-страницу со свободным текстом, списками, таблицами, заголовками и т. д. на предложения? Возьмем, к примеру, эту страницу в Википедии. Есть/есть :свободный текст:http://en.wikipedia.org/wiki/...
Общие сведения Требуется автоматизировать создание доменов в JasperServer. Домены - это «просмотр» данных для создания специальных отчетов. Имена столбцов должны быть представлены пользователю в удобочитаемом виде ...
Недавно я наткнулся на этот вопрос интервью:Учитывая непрерывную ленту в Твиттере, разработайте алгоритм, который будет возвращать 100 самых популярных слов в Твиттере. часто употребляемые слова в эту минуту, в этот час и в этот день. Я подумал...
Посмотрите, например, в AppleScript (и существует много других, некоторые по общему признанию довольно хорошие), которые рекламируют их использование метафоры естественного языка. Код, по-видимому, более читаем потому что это...
I managed to create Earley recognizer, everything works fine. I have all proper sets of situation. But I only can use it to decide if word is accepted by grammar. How to make it to parse? I need some ...
Мне было интересно, как лучше всего преобразовать что-то вроде «haaaaapppppyyy» в «haappyy». По сути, при разборе сленга люди иногда повторяют символы для дополнительного акцента. Мне было интересно...
Я работаю над задачами классификации документов в java. Оба алгоритма были настоятельно рекомендованы, каковы преимущества и недостатки каждого и какой из них чаще используется в литературе для ...
Мой текущий проект веб-приложения -требует небольшого НЛП :Токенизация текста в предложения с помощью Punkt и подобных; Разбивая более длинные предложения придаточным предложением (, оно часто ставится через запятую, за исключением случаев, когда оно’...
URL-адреса в файле 'readme' недействительны (http://www.fjoch.com/mkcls.html и http://www.fjoch.com/GIZA++.html). Есть ли хороший учебник по giza ++? Или есть альтернативы, которые ...
Я давно размышляю об этом, и я не понимаю, почему Google еще не пробовал это - или, может быть, они пробовали, а я просто не знаю об этом. Есть ли поисковик, в котором можно ввести вопрос ...
Вопрос для всех, кто использовал класс SimpleTagger библиотеки Java для условных случайных полей (CRF) из библиотеки Java. Предположим, что я уже использую многопоточность для максимального числа ...
Я хочу сделать очень простую работу: мне нужно разрешить строку, содержащую местоимения. например, я хочу перевернуть предложение «У Мэри есть овечка. Она милая». в «У Мэри есть ягненок...
Будучи студентом инженерного факультета, я хотел бы создать чат-бота с использованием Python. Итак, я много искал, но так и не смог найти ничего, что могло бы научить меня или дать конкретную информацию для создания...