0
ответов

Есть ли способ получить тему предложения с помощью OpenNLP?

Есть ли способ получить тему предложения с помощью OpenNLP? Я пытаюсь выделить самую важную часть предложения пользователя. Как правило, пользователи будут отправлять предложения в наш «движок» и ...
вопрос задан: 18 August 2015 10:47
0
ответов

Кто-нибудь знает какое-нибудь хорошее программное обеспечение для устранения неоднозначности в Word? [closed]

Что представляет собой современное программное обеспечение для устранения неоднозначности слов (WSD)? Какие показатели определяют состояние дел и какие инструменты / пакеты с открытым исходным кодом доступны?
вопрос задан: 5 August 2015 22:10
0
ответов

Распознавание именованных сущностей NLTK в списке Python

Я использовал ne_chunk NLTK для извлечения именованных сущностей из текста: my_sent = "ВАШИНГТОН - После ряда злоупотреблений со стороны нью-йоркских полицейских в 1990-х годах, Лоретта Э. Линч, высшая федеральная власть ...
вопрос задан: 5 August 2015 14:58
0
ответов

Python: Как предварить строку 'ub' к каждому произносимому гласному в строке?

Пример: Speak -> Spubeak, подробнее здесь Не давайте мне решения, но укажите мне правильное направление или скажите, какую библиотеку python я мог бы использовать? Я думаю о regex, так как я должен найти ...
вопрос задан: 15 July 2015 15:25
0
ответов

Использование NLTK и WordNet ; как преобразовать глагол простого времени в настоящее, Форма причастия прошедшего или прошедшего времени?

Как с помощью NLTK и WordNet преобразовать глагол простого времени в формы причастия настоящего, прошедшего или прошедшего времени? Например: я хочу написать функцию, которая дала бы мне глагол в ожидаемой форме как ...
вопрос задан: 12 April 2015 15:20
0
ответов

Реализация оценки BLEU для обнаружения сходства предложений

Мне нужно рассчитать оценку BLEU для определения того, похожи ли два предложения или нет. Я прочитал несколько статей, которые в основном посвящены оценке BLEU для измерительной машины точность перевода. Но я ...
вопрос задан: 6 March 2015 15:36
0
ответов

метафон против soundex против NYSIIS

Я пытаюсь придумать неявную проверку орфографии, которая будет использовать сопоставление входных слов с каким-то более общим фонетическим представлением для учета опечаток, которые могут возникнуть, в основном для...
вопрос задан: 23 February 2015 22:31
0
ответов

Обработка общих синонимов и частей речи с использованием nltk

Я пытаюсь создать общий идентификатор синонимов для слов в предложении, которые являются значимыми (т.е. не «a» или «the»), и я использую набор инструментов для естественного языка (nltk) в python для него. The ...
вопрос задан: 22 February 2015 21:51
0
ответов

Обнаружение слогов PHP [закрыто]

Я хотел бы найти способ разбить слово на слоги с помощью PHP. Например, слово «nevermore», пробежавшееся через detect_syllables (), вернет «nev-er-more». Есть ли хорошие API или ...
вопрос задан: 20 February 2015 03:11
0
ответов

Как получить прошедшее время глагола? [закрыто]

Каков наиболее эффективный способ получить прошедшее время глагола, желательно без использования фреймворков НЛП с тяжелым объемом памяти? например дожить до: дожить до: попробовать коснуться: постучать доварить до: сварить до продать: ...
вопрос задан: 20 February 2015 01:57
0
ответов

Учебники по обработке естественного языка [закрыто]

Недавно я посетил курс на Coursera по теме «Обработка естественного языка» и много узнал о синтаксическом анализе, IR и других интересных аспектах, таких как вопросы и ответы и т. д., хотя я хорошо усвоил концепции, но…
вопрос задан: 21 December 2014 05:20
0
ответов

Парсер для Википедии

Я загрузил дамп Википедии и хочу преобразовать формат вики в формат моего объекта. Есть ли вики-анализатор, конвертирующий объект в XML?
вопрос задан: 9 December 2014 11:35
0
ответов

Проекты машинного обучения с открытым исходным кодом, ориентированные на веб / браузер?

Применение методов машинного обучения, в частности методов интеллектуального анализа текста, в среде браузера (в основном Javascript) или в качестве веб-приложения не является очень широко обсуждаемой темой. Я хочу ...
вопрос задан: 1 December 2014 19:29
0
ответов

Пытаюсь использовать HPSG PET Parser

Привет, я пытаюсь использовать PET Parser, но документация предоставлено для использования недостаточно. Может ли кто-нибудь указать мне на хорошую статью или руководство по использованию ПЭТ? Поддерживает ли он utf-8?
вопрос задан: 25 September 2014 14:21
0
ответов

Проверка орфографии и/или исправление орфографии в Java [дубликат]

Как выполнить проверку орфографии и/или исправление орфографии в приложении Java?
вопрос задан: 21 September 2014 08:23
0
ответов

Простой алгоритм проверки орфографии

Мне было поручено создать простую программу проверки орфографии для задания, но я почти не дал никаких указаний, поэтому мне было интересно, может ли кто-нибудь мне помочь. Я не ищу кого-то, кто выполнит задание для ...
вопрос задан: 20 September 2014 10:05
0
ответов

Статистический подход к разбиению слов

Я хочу решить проблему разбиения слов (разбирать слова из длинной строки без пробелов). Например, мы хотим извлечь слова из somelongword в [some, long, word]. Мы можем добиться этого с помощью некоторой динамической...
вопрос задан: 9 September 2014 01:06
0
ответов

Разбор HTML на предложения -Как работать с таблицами/списками/заголовками и т. д.?

Как вы разбираете HTML-страницу со свободным текстом, списками, таблицами, заголовками и т. д. на предложения? Возьмем, к примеру, эту страницу в Википедии. Есть/есть :свободный текст:http://en.wikipedia.org/wiki/...
вопрос задан: 8 September 2014 04:07
0
ответов

Как разделить слова в «предложении» пробелами?

Общие сведения Требуется автоматизировать создание доменов в JasperServer. Домены - это «просмотр» данных для создания специальных отчетов. Имена столбцов должны быть представлены пользователю в удобочитаемом виде ...
вопрос задан: 8 September 2014 03:37
0
ответов

Отслеживание в режиме реального времени 100 самых популярных слов в Твиттере в минуту/час/день

Недавно я наткнулся на этот вопрос интервью:Учитывая непрерывную ленту в Твиттере, разработайте алгоритм, который будет возвращать 100 самых популярных слов в Твиттере. часто употребляемые слова в эту минуту, в этот час и в этот день. Я подумал...
вопрос задан: 6 September 2014 20:45
0
ответов

Подобие является на “естественный язык” убедительным коммерческим аргументом для языка программирования? [закрытый]

Посмотрите, например, в AppleScript (и существует много других, некоторые по общему признанию довольно хорошие), которые рекламируют их использование метафоры естественного языка. Код, по-видимому, более читаем потому что это...
вопрос задан: 24 August 2014 01:52
0
ответов

Earley recognizer to Earley parser

I managed to create Earley recognizer, everything works fine. I have all proper sets of situation. But I only can use it to decide if word is accepted by grammar. How to make it to parse? I need some ...
вопрос задан: 17 August 2014 23:20
0
ответов

Удалить повторяющиеся символы из слов

Мне было интересно, как лучше всего преобразовать что-то вроде «haaaaapppppyyy» в «haappyy». По сути, при разборе сленга люди иногда повторяют символы для дополнительного акцента. Мне было интересно...
вопрос задан: 13 March 2014 17:59
0
ответов

Каковы основные отличия и преимущества алгоритмов Стемминга Портера и Ланкастера? [закрыто]

Я работаю над задачами классификации документов в java. Оба алгоритма были настоятельно рекомендованы, каковы преимущества и недостатки каждого и какой из них чаще используется в литературе для ...
вопрос задан: 4 March 2014 06:19
0
ответов

Основы НЛП в CoffeeScript или JavaScript — токенизация точек, простые обученные байесовские модели — с чего начать? [закрыто]

Мой текущий проект веб-приложения -требует небольшого НЛП :Токенизация текста в предложения с помощью Punkt и подобных; Разбивая более длинные предложения придаточным предложением (, оно часто ставится через запятую, за исключением случаев, когда оно’...
вопрос задан: 21 February 2014 14:02
0
ответов

Есть ли учебник по giza ++? [закрыто]

URL-адреса в файле 'readme' недействительны (http://www.fjoch.com/mkcls.html и http://www.fjoch.com/GIZA++.html). Есть ли хороший учебник по giza ++? Или есть альтернативы, которые ...
вопрос задан: 8 February 2014 00:44
0
ответов

Есть ли поисковая система, которая даст прямой ответ? [закрыто]

Я давно размышляю об этом, и я не понимаю, почему Google еще не пробовал это - или, может быть, они пробовали, а я просто не знаю об этом. Есть ли поисковик, в котором можно ввести вопрос ...
вопрос задан: 23 December 2013 21:06
0
ответов

Настройка производительности Mallet CRF SimpleTagger

Вопрос для всех, кто использовал класс SimpleTagger библиотеки Java для условных случайных полей (CRF) из библиотеки Java. Предположим, что я уже использую многопоточность для максимального числа ...
вопрос задан: 11 December 2013 13:11
0
ответов

Разрешить кореференцию с помощью Stanford CoreNLP — невозможно загрузить модель парсера

Я хочу сделать очень простую работу: мне нужно разрешить строку, содержащую местоимения. например, я хочу перевернуть предложение «У Мэри есть овечка. Она милая». в «У Мэри есть ягненок...
вопрос задан: 10 November 2013 18:58
0
ответов

Какие-нибудь руководства по разработке чат-ботов? [закрыто]

Будучи студентом инженерного факультета, я хотел бы создать чат-бота с использованием Python. Итак, я много искал, но так и не смог найти ничего, что могло бы научить меня или дать конкретную информацию для создания...
вопрос задан: 25 July 2013 23:00