0
ответов

поиск существительного и глагола в stanford parser

Мне нужно определить, является ли слово глаголом или существительным или и тем, и другим. Например, слово «поиск» может быть как существительным, так и глагол, но stanford parser дает ему тег NN .. есть ли способ, которым stanford ...
вопрос задан: 4 October 2010 11:50
0
ответов

Устранение неоднозначности имен людей

В настоящее время я работаю над проектом по устранению неоднозначности имен людей. Идея, лежащая в основе проекта, заключается в том, что он сможет идентифицировать правильного человека, когда есть несколько человек с одним и тем же именем. Я ...
вопрос задан: 4 October 2010 03:38
0
ответов

Justadistraction: разметка английского языка без пробелов. Murakami SheepMan

Мне было интересно, как бы вы стали маркировать строки на английском (или других западных языках), если бы были удалены пробелы? Вдохновением для вопроса послужил персонаж Овцы в «Мураками» ...
вопрос задан: 3 October 2010 21:57
0
ответов

Варианты написания имени

В рамках системы управления контактами у меня есть большая база данных имен. Люди часто редактируют это, и в результате мы сталкиваемся с проблемами одного и того же человека, существующего в разных формах (Джон Смит и ...
вопрос задан: 28 September 2010 02:21
0
ответов

Алгоритм обработки естественного языка для настроения электронного письма

Один простой вопрос (но я не нашел очевидного ответ в материалах о НЛП, которые я читал и в которых я новичок): я хочу классифицировать электронные письма с вероятностью по определенным параметрам ...
вопрос задан: 23 September 2010 14:15
0
ответов

Как ускорить загрузку DTD с помощью DOCTYPE

Мне нужно загрузить несколько файлов xhtml, которые это должно быть вверху:
вопрос задан: 17 September 2010 08:01
0
ответов

Как мне управлять деревьями синтаксического анализа?

Я играл с деревьями синтаксического анализа естественного языка и манипулировать ими различными способами. Я использовал инструменты Стэнфорда Tregex и Tsurgeon, но код беспорядочный и не подходит ...
вопрос задан: 12 September 2010 11:03
0
ответов

How to efficiently filter a string against a long list of words in Python/Django?

Stackoverflow implemented its "Related Questions" feature by taking the title of the current question being asked and removing from it the 10,000 most common English words according to Google. The ...
вопрос задан: 4 September 2010 06:25
0
ответов

Автоматический перевод текста

Какие инструменты или веб-сервисы доступны для машинного перевода текста. Например, ENGLISH TEXT> SERVER или LIB> GERMAN TEXT Библиотеки также приемлемы. Является ли API языка Google единственным ...
вопрос задан: 4 September 2010 00:23
0
ответов

Извлечь неверно отформатированную дату из строки (анализ даты, NLP)

У меня есть большой список файлов, некоторые из которых содержат даты в имени файла. Формат дат непоследователен и часто бывает неполным, например, «Август 06», «Август 2006», «Август 2006», «08-06», «01- 08 -...
вопрос задан: 10 August 2010 06:27
0
ответов

В чем разница между закрытием ввода / OutputStream и непосредственное закрытие Socket?

Мне просто интересно, что делает java, когда мы вызываем close для inputStream и outStream, связанных с сокетом. В чем отличие от вызова close на сокете, т.е. Socket.close (). если мы просто ...
вопрос задан: 7 August 2010 00:57
0
ответов

Где может я находить получить дамп необработанного текста в сети?

Я надеюсь делать некоторый анализ текста в программе, которую я пишу. Я ищу альтернативные источники текста в его необработанной форме, подобной тому, что обеспечивается в дампах Википедии (download.wikimedia.com)...
вопрос задан: 2 August 2010 13:44
0
ответов

Соответствие подстрокам от словаря до другой строки: предложения?

Привет люди Переполнения стека. Я хотел бы некоторые предложения относительно следующей проблемы. Я использую Java. У меня есть массив № 1 со многими Строками. Например, две из строк могли бы быть: "...
вопрос задан: 6 January 2010 15:30