0
ответов

Ошибка при построении Stanford CoreNLP

Когда я создаю Core-NLP самостоятельно, я получаю следующее сообщение: несовместимые типы; не существует экземпляров переменных типа VALUE, так что VALUE соответствует Map Нарушение ...
вопрос задан: 23 October 2011 01:43
0
ответов

Сжатие предложений с использованием NLP [closed]

Используя машинный перевод, могу ли я получить очень сжатую версию предложения, например . Я действительно хочу выпить восхитительный вкусный кофе. Будет переведено на Хочу кофе Есть ли что-нибудь из ...
вопрос задан: 22 October 2011 05:37
0
ответов

Что означают сокращения в тегах POS и т. Д.?

Скажем, у меня есть следующее Penn Tree: (S (NP-SBJ, стальной удар) (VP длился (ADVP-TMP (ADVP намного дольше) (SBAR, чем ( S (NP-SBJ he) (...
вопрос задан: 21 October 2011 17:52
0
ответов

исчисляемость существительных

Есть ли какие-нибудь рекомендации по определению исчисляемости существительных? Или какой-то способ, как это сделать, или словарь, в котором записано, является ли существительное исчисляемым или неисчисляемым? Я не ...
вопрос задан: 19 October 2011 14:32
0
ответов

Обработка естественного языка в PHP

Учитывая, скажем, рецепт (список ингредиентов, этапов и т. Д.) В форме произвольного текста, как я могу разобрать что таким образом я могу извлекать ингредиенты (например, количество, единицы измерения, название ингредиента, ...
вопрос задан: 18 October 2011 23:05
0
ответов

Как разобрать список слов в соответствии с упрощенной грамматикой?

Чтобы уточнить, это не домашнее задание. Меня попросили помочь с этим, но я не могу это сделать, поэтому решение превратилось в личный квест. Представьте, что у вас есть грамматика для английского предложения вроде ...
вопрос задан: 18 October 2011 07:02
0
ответов

Обнаружение языка методом грубой силы

Мне нужен алгоритм (любой язык программирования) для проверки жизнеспособности с помощью алгоритма восхождения на холм для взлома шифра для криптографической задачи. Алгоритм должен проверить, насколько вероятно, что ...
вопрос задан: 18 October 2011 00:01
0
ответов

НЛТК / НЛП построение предметного классификатора "многие-ко-многим" / с несколькими ярлыками

У меня есть помеченный людьми корпус из более чем 5000 тематические индексированные документы в XML. Они различаются по размеру от нескольких сотен килобайт до нескольких сотен мегабайт. Краткие статьи к рукописям. У них ...
вопрос задан: 15 October 2011 19:32
0
ответов

Какой пакет с открытым исходным кодом для кластеризации документов лучше всего?

Какой пакет с открытым исходным кодом лучше всего подходит для кластеризации большого корпуса документов? Он должен либо сам определять количество кластеров, либо принимать это в качестве параметра. У нас есть большой ...
вопрос задан: 13 October 2011 10:30
0
ответов

Анализ настроения на других языках

Мой выпускной проект по CSE Я выбрал симуляцию поисковой системы, которая использует анализ настроения для оценки того, являются ли комментарии/отзывы положительными/отрицательными/нейтральными Я не уверен, как я буду ...
вопрос задан: 13 October 2011 08:31
0
ответов

Как создать пакет слов, используя Weka?

У меня есть корпус документов, и я хочу представить каждый документ как вектор. По сути, вектор будет иметь 1 для слов, которые присутствуют внутри документа, и для других слов (которые присутствуют ...
вопрос задан: 10 October 2011 07:26
0
ответов

Как мне лучше всего определить правильное использование заглавных букв для слова?

У меня есть база данных, содержащая предложения, содержащие только заглавные буквы. База данных техническая, содержит медицинские термины, и я хочу нормализовать ее так, чтобы заглавные буквы были (близки к) ...
вопрос задан: 9 October 2011 21:32
0
ответов

Стратегия синтаксического анализа описаний естественного языка в структурированные данные

У меня есть набор требований, и я ищу лучшую стратегию / алгоритм / программное обеспечение на основе Java для использования. По сути, я хочу взять набор рецептурных ингредиентов, введенных реальными людьми в натуральном ...
вопрос задан: 7 October 2011 22:30
0
ответов

Определение важных слов и фраз в тексте

У меня есть текст, хранящийся в строке python. Что я хочу Определить ключевые слова в этом тексте. Определить N-граммы в этом тексте (в идеале больше, чем просто би- и триграммы). Имейте в виду... Текст может быть ...
вопрос задан: 6 October 2011 16:36
0
ответов

Как работает определение языка?

Некоторое время я задавался вопросом, как Google translate (или, возможно, гипотетический переводчик) определяет язык по строке, введенной в поле «from». Я думал об этом, и только ...
вопрос задан: 6 October 2011 05:41
0
ответов

НЛП и машинное обучение для анализа настроений [закрыто]

Я пытаюсь написать программу, которая принимает текст (статью) в качестве входных данных и выводит полярность этого текста, независимо от его положительного или отрицательного настроения. Я много читал о различных подходах ...
вопрос задан: 4 October 2011 05:05
0
ответов

Как точно заменить строку с помощью gsub ()

У меня есть корпус: txt = "узорчатый слой в микроэлектронном узоре". { {1}} Я хочу заменить термин "шаблон" именно на "форма", я пытаюсь написать код: txt_replaced = gsub ("шаблон", "форма", ...
вопрос задан: 2 October 2011 15:11
0
ответов

Алгоритм NLP для «заполнения» условий поиска

Я пытаюсь написать алгоритм (который я Предполагаю, будет полагаться на методы обработки естественного языка), чтобы «заполнить» список условий поиска. Вероятно, есть название для такого рода вещей, которое я '...
вопрос задан: 29 September 2011 23:30
0
ответов

Быстрый расчет n-граммов

Я использую NLTK для поиска n-граммов в корпусе, но это требует в некоторых случаях очень долго. Я заметил, что вычисление n-граммов не является редкостью в других пакетах (очевидно, в Haystack есть ...
вопрос задан: 29 September 2011 10:51
0
ответов

Обучающие данные для анализа настроений [закрыто]

Где я могу получить корпус документов, которые уже были классифицированы как положительные / отрицательные по настроениям в корпоративной сфере? Мне нужен большой корпус документов, содержащих обзоры для ...
вопрос задан: 27 September 2011 01:36
0
ответов

Преобразование прилагательных и наречий в их формы существительных

Я экспериментирую с устранением неоднозначности слов, используя wordnet для своего проекта. В рамках проекта я хотел бы преобразовать производное прилагательное или форму наречия в форму корневого существительного. Для ...
вопрос задан: 25 September 2011 20:44
0
ответов

Какое сходство функции nltk.corpus.wordnet подходит для находки сходства двух слов?

Какая функция сходства в nltk.corpus.wordnet подходит для поиска сходства двух слов? path_similerity ()? lch_similerity ()? wup_similerity ()? res_similerity ()? ...
вопрос задан: 13 September 2011 12:32
0
ответов

Полнотекстовые PDF-файлы для статей PubMed

Во время работы над проектом мне нужно загрузить и обработать полнотекстовые статьи для рефератов PubMed, есть ли какой-либо реализованный код или инструмент, который позволяет пользователю ввести набор идентификаторов PubMed и загрузок ...
вопрос задан: 12 September 2011 23:48
0
ответов

Как соединить арабские буквы в слова

Я должен прочитать арабские буквы из xml файла и отобразить их в виде ввода слова :س ع ا ا د ة. вывод :سعادة выглядит так ... Я не знаю, как это сделать на каком-нибудь языке, какой алгоритм читать, мне нужно немного ...
вопрос задан: 11 September 2011 08:40
0
ответов

Группирование предложений по настроению

Начнем с простой задачи. Предположим, у меня есть предложение из 350 символов, и я хотел бы отнести его к категории "Хорошее настроение" или "Плохое настроение". Как лучше всего ...
вопрос задан: 9 September 2011 01:24
0
ответов

Декодирование Переставленные английские Последовательности

коллегу А недавно спросили это при попытке посадить (другую) исследовательскую работу: Учитывая 10 128 символьных строк, которые были переставлены точно таким же образом, декодируйте последовательности. Оригинал...
вопрос задан: 8 September 2011 00:37
0
ответов

NLP-программа для классификации больших наборов данных

Background В течение многих лет я использовал свои собственные байесовские методы для классификации новых элементов из внешних источников на основе большого и постоянно обновляемого набора обучающих данных. Существует три типа ...
вопрос задан: 30 August 2011 19:00
0
ответов

Обнаружение глаголов Javascript

У меня следующая проблема. Мне нужно найти глаголы в строке с помощью JavaScript. Я хотел бы знать, есть ли что-то вроде (JAWS), Java API для Wordnet, но для JavaScript. Точнее ...
вопрос задан: 28 August 2011 20:49
0
ответов

Применение SVD мгновенно выдает ошибку памяти?

Я пытаюсь применить SVD к моей матрице (3241 x 12596), полученной после некоторой обработки текста (с конечной целью выполнения латентного семантического анализа), и я не могу понять, почему это происходит. ..
вопрос задан: 22 August 2011 06:28
0
ответов

Сравнение двух английских строк на предмет сходства

Итак, вот моя проблема. У меня есть два абзаца текста, и мне нужно посмотреть, похожи ли они. Не в смысле строковых показателей, а в смысле. Следующие два абзаца связаны, но мне нужно ...
вопрос задан: 17 August 2011 00:35