В настоящее время я читаю «Обработку естественного языка для работающего программиста» (книга в стадии разработки http://nlpwp.org/) и задаюсь вопросом, есть ли приличная библиотека для статистического естественного языка ...
У меня есть большой набор строк, которые я использую для исследование обработки естественного языка, и я хотел бы иметь хороший способ сохранить его на Python. Я мог бы использовать pickle, но загрузка всего списка в память могла бы ...
Я пишу программу чтения RSS на python в качестве учебного упражнения, и мне бы очень хотелось иметь возможность добавлять теги отдельные записи с ключевыми словами для поиска. К сожалению, большинство реальных каналов не ...
Я искал библиотеку OCR - оптимально она была бы с открытым исходным кодом - которую я мог бы использовать для некоторых арабских PDF-файлов. Погуглить ничего полезного не дало. Мне интересно, знает ли кто-нибудь ...
Привет, я новичок в Python и НЛП. Мне нужно реализовать классификатор перцептронов. Я искал на некоторых сайтах, но не нашел достаточно информации. На данный момент у меня есть несколько документов, в которых я ...
У меня есть набор документов, и я хочу вернуть список кортежей, где каждый кортеж имеет дату данного документа и количество раз, когда данный поисковый запрос встречается в этом документе. Мой код (ниже) ...
Я пытаюсь понять, какой показатель релевантности возвращает opencalais для каждой сущности? Что это означает и как это толковать? Буду благодарен за понимание ...
Я ищу простой способ определить, является ли короткий отрывок текста несколькими предложениями , английский или нет. Мне кажется, что эта проблема намного проще, чем попытка обнаружить произвольный язык. Является ли ...
Для проблемы, над которой я работаю, нахождение расстояний между двумя последовательностями до Определите их сходство, порядок следования очень важен. Однако последовательности, которые у меня есть, не имеют одинаковой длины ...
Я изучаю НЛП. Я сейчас играю с устранением неоднозначности слова. Я планирую использовать корпус semcor в качестве обучающих данных, но у меня проблемы с пониманием структуры xml. Я пробовал погуглить, но ...
Мне нужно разобрать небольшое подмножество английского языка для одного из моих проектов, описанного как контекстно-свободная грамматика с ( 1-уровневые) структуры функций (пример), и мне нужно сделать это эффективно. Прямо сейчас я '...
С момента появления больших веб-приложений поиск данных (и выполнение его молниеносно и точно) был одним из самые важные проблемы в веб-приложениях. Какое-то время я работал ...
В настоящее время я пытаюсь создать универсальный (или настолько общий, насколько это практически возможно) POS-теггер с NLTK. Я баловался коричневым корпусом и корпусом treebank для обучения, но, вероятно, остановлюсь на ...
Мне интересно узнать больше о машинном переводе. Хотя у меня есть несколько очень интересных книг по этому поводу, я хотел бы увидеть некоторые реальные приложения теорий МП. Я нашел парочку ...
Пусть кто-нибудь знает какие-либо хорошие библиотеки для .NET, которые могут помочь извлечь ключевые слова из блоков естественного языка. Я в основном пытаюсь вырезать стоп-слова и игнорировать времена, множественное число и ...
Я пытаюсь обучить наивный байесовский классификатор с извлечением положительных / отрицательных слов из настроение. пример: я обожаю этот фильм :)) ненавижу, когда идет дождь :( Идея в том, что я извлекаю позитив ...
Как лучше всего использовать сами слова в качестве признаков в любом алгоритме машинного обучения? Проблема, которую я должен извлечь из определенного абзаца. Следует ли мне использовать ...
Мое требование состоит в том, чтобы брать новостные статьи и определять, являются ли они положительными или отрицательными по предмету. Я использую подход, описанный ниже, но продолжаю читать, что НЛП может быть здесь полезно. Все ...
Мне было интересно, знает ли кто-нибудь о хороших модулях Perl и / или классах Java для анализа настроений. Я читал о LingPipe, но в конечном итоге программу нужно будет использовать для коммерческого использования, поэтому ...
Я просматриваю веб-страницы в поисках грамматики английского языка, но нашел только несколько простых примеров, например: s -> np vp
np -> det n
vp -> v | v np
det -> 'a' | 'the'
n -> 'женщина' | 'человек'
v -> ...
Есть ли библиотека или веб-служба, которая может сказать вам произношение строки? Я думаю о символьных языках, в которых произношение слова не очевидно из того, как оно написано.
Как найти правильные слова в длинном потоке символов? Входные данные: «Пересмотренный отчет о синтаксических теориях последовательного управления и состояния». Вывод Google: «Пересмотренный отчет о ...
I would like to synchronize a spoken recording against a known text. Is there a speech-to-text / natural language processing library that would facilitate this? I imagine I'd want to detect word ...
Я медсестра и знаю python, но я не эксперт, просто использовал его для обработки последовательностей ДНК
У нас есть больничные записи, написанные на человеческом языке, и я должен вставить эти данные в базу данных ...
Hii, я столкнулся с вопросом об использовании словаря, который может реализовывать функции автозаполнения, автокоррекции, проверки орфографии и т. Д. Я действительно хотел узнать, какие данные ...
I would like to build an internal search engine (I have a very large collection of thousands of XML files) that is able to map queries to concepts. For example, if I search for "big cats", I would ...
Грамматика по определению содержит продукты, пример очень простой грамматики: E -> E + E
E -> n Я хочу реализовать класс Grammar в C #, но я не уверен, как хранить продукты, например ...
Я слышал, что Perl часто используется для NLP, но я не могу найти почти никаких хороших инструментов NLP для Perl . Какие есть хорошие инструменты / ресурсы Perl NLP? У Python есть NLTK. В Java есть OpenNLP. Есть ли в Perl что-нибудь ...
Только начало работы с Lucene.Net. Я проиндексировал 100 000 строк с помощью стандартного анализатора, выполнил несколько тестовых запросов и заметил, что множественные запросы не возвращают результатов, если исходный термин был в единственном числе. Я .