nlp - список вопросов по программированию nlp

0

ответов

Ошибка при построении Stanford CoreNLP

Когда я создаю Core-NLP самостоятельно, я получаю следующее сообщение: несовместимые типы; не существует экземпляров переменных типа VALUE, так что VALUE соответствует Map Нарушение ...

java nlp stanford-nlp

вопрос задан: 23 October 2011 01:43

0

ответов

Сжатие предложений с использованием NLP [closed]

Используя машинный перевод, могу ли я получить очень сжатую версию предложения, например . Я действительно хочу выпить восхитительный вкусный кофе. Будет переведено на Хочу кофе Есть ли что-нибудь из ...

nlp nltk stanford-nlp opennlp

вопрос задан: 22 October 2011 05:37

0

ответов

Что означают сокращения в тегах POS и т. Д.?

Скажем, у меня есть следующее Penn Tree: (S (NP-SBJ, стальной удар) (VP длился (ADVP-TMP (ADVP намного дольше) (SBAR, чем ( S (NP-SBJ he) (...

language-agnostic nlp stanford-nlp

вопрос задан: 21 October 2011 17:52

0

ответов

исчисляемость существительных

Есть ли какие-нибудь рекомендации по определению исчисляемости существительных? Или какой-то способ, как это сделать, или словарь, в котором записано, является ли существительное исчисляемым или неисчисляемым? Я не ...

nlp

вопрос задан: 19 October 2011 14:32

0

ответов

Обработка естественного языка в PHP

Учитывая, скажем, рецепт (список ингредиентов, этапов и т. Д.) В форме произвольного текста, как я могу разобрать что таким образом я могу извлекать ингредиенты (например, количество, единицы измерения, название ингредиента, ...

php algorithm nlp

вопрос задан: 18 October 2011 23:05

0

ответов

Как разобрать список слов в соответствии с упрощенной грамматикой?

Чтобы уточнить, это не домашнее задание. Меня попросили помочь с этим, но я не могу это сделать, поэтому решение превратилось в личный квест. Представьте, что у вас есть грамматика для английского предложения вроде ...

algorithm haskell lisp nlp

вопрос задан: 18 October 2011 07:02

0

ответов

Обнаружение языка методом грубой силы

Мне нужен алгоритм (любой язык программирования) для проверки жизнеспособности с помощью алгоритма восхождения на холм для взлома шифра для криптографической задачи. Алгоритм должен проверить, насколько вероятно, что ...

java algorithm cryptography nlp

вопрос задан: 18 October 2011 00:01

0

ответов

НЛТК / НЛП построение предметного классификатора "многие-ко-многим" / с несколькими ярлыками

У меня есть помеченный людьми корпус из более чем 5000 тематические индексированные документы в XML. Они различаются по размеру от нескольких сотен килобайт до нескольких сотен мегабайт. Краткие статьи к рукописям. У них ...

python statistics nlp machine-learning nltk

вопрос задан: 15 October 2011 19:32

0

ответов

Какой пакет с открытым исходным кодом для кластеризации документов лучше всего?

Какой пакет с открытым исходным кодом лучше всего подходит для кластеризации большого корпуса документов? Он должен либо сам определять количество кластеров, либо принимать это в качестве параметра. У нас есть большой ...

nlp machine-learning cluster-analysis

вопрос задан: 13 October 2011 10:30

0

ответов

Анализ настроения на других языках

Мой выпускной проект по CSE Я выбрал симуляцию поисковой системы, которая использует анализ настроения для оценки того, являются ли комментарии/отзывы положительными/отрицательными/нейтральными Я не уверен, как я буду ...

artificial-intelligence nlp machine-learning sentiment-analysis

вопрос задан: 13 October 2011 08:31

0

ответов

Как создать пакет слов, используя Weka?

У меня есть корпус документов, и я хочу представить каждый документ как вектор. По сути, вектор будет иметь 1 для слов, которые присутствуют внутри документа, и для других слов (которые присутствуют ...

nlp weka

вопрос задан: 10 October 2011 07:26

0

ответов

Как мне лучше всего определить правильное использование заглавных букв для слова?

У меня есть база данных, содержащая предложения, содержащие только заглавные буквы. База данных техническая, содержит медицинские термины, и я хочу нормализовать ее так, чтобы заглавные буквы были (близки к) ...

nlp

вопрос задан: 9 October 2011 21:32

0

ответов

Стратегия синтаксического анализа описаний естественного языка в структурированные данные

У меня есть набор требований, и я ищу лучшую стратегию / алгоритм / программное обеспечение на основе Java для использования. По сути, я хочу взять набор рецептурных ингредиентов, введенных реальными людьми в натуральном ...

java nlp dsl text-parsing

вопрос задан: 7 October 2011 22:30

0

ответов

Определение важных слов и фраз в тексте

У меня есть текст, хранящийся в строке python. Что я хочу Определить ключевые слова в этом тексте. Определить N-граммы в этом тексте (в идеале больше, чем просто би- и триграммы). Имейте в виду... Текст может быть ...

python nlp nltk

вопрос задан: 6 October 2011 16:36

0

ответов

Как работает определение языка?

Некоторое время я задавался вопросом, как Google translate (или, возможно, гипотетический переводчик) определяет язык по строке, введенной в поле «from». Я думал об этом, и только ...

algorithm nlp pattern-matching

вопрос задан: 6 October 2011 05:41

0

ответов

НЛП и машинное обучение для анализа настроений [закрыто]

Я пытаюсь написать программу, которая принимает текст (статью) в качестве входных данных и выводит полярность этого текста, независимо от его положительного или отрицательного настроения. Я много читал о различных подходах ...

artificial-intelligence nlp machine-learning data-mining classification

вопрос задан: 4 October 2011 05:05

0

ответов

Как точно заменить строку с помощью gsub ()

У меня есть корпус: txt = "узорчатый слой в микроэлектронном узоре". { {1}} Я хочу заменить термин "шаблон" именно на "форма", я пытаюсь написать код: txt_replaced = gsub ("шаблон", "форма", ...

r nlp

вопрос задан: 2 October 2011 15:11

0

ответов

Алгоритм NLP для «заполнения» условий поиска

Я пытаюсь написать алгоритм (который я Предполагаю, будет полагаться на методы обработки естественного языка), чтобы «заполнить» список условий поиска. Вероятно, есть название для такого рода вещей, которое я '...

python nlp n-gram

вопрос задан: 29 September 2011 23:30

0

ответов

Быстрый расчет n-граммов

Я использую NLTK для поиска n-граммов в корпусе, но это требует в некоторых случаях очень долго. Я заметил, что вычисление n-граммов не является редкостью в других пакетах (очевидно, в Haystack есть ...

python nlp nltk n-gram

вопрос задан: 29 September 2011 10:51

0

ответов

Обучающие данные для анализа настроений [закрыто]

Где я могу получить корпус документов, которые уже были классифицированы как положительные / отрицательные по настроениям в корпоративной сфере? Мне нужен большой корпус документов, содержащих обзоры для ...

nlp machine-learning text-analysis sentiment-analysis training-data

вопрос задан: 27 September 2011 01:36

0

ответов

Преобразование прилагательных и наречий в их формы существительных

Я экспериментирую с устранением неоднозначности слов, используя wordnet для своего проекта. В рамках проекта я хотел бы преобразовать производное прилагательное или форму наречия в форму корневого существительного. Для ...

python nlp wordnet linguistics

вопрос задан: 25 September 2011 20:44

0

ответов

Какое сходство функции nltk.corpus.wordnet подходит для находки сходства двух слов?

Какая функция сходства в nltk.corpus.wordnet подходит для поиска сходства двух слов? path_similerity ()? lch_similerity ()? wup_similerity ()? res_similerity ()? ...

python nlp nltk wordnet corpus

вопрос задан: 13 September 2011 12:32

0

ответов

Полнотекстовые PDF-файлы для статей PubMed

Во время работы над проектом мне нужно загрузить и обработать полнотекстовые статьи для рефератов PubMed, есть ли какой-либо реализованный код или инструмент, который позволяет пользователю ввести набор идентификаторов PubMed и загрузок ...

pdf nlp text-mining pubmed

вопрос задан: 12 September 2011 23:48

0

ответов

Как соединить арабские буквы в слова

Я должен прочитать арабские буквы из xml файла и отобразить их в виде ввода слова :س ع ا ا د ة. вывод :سعادة выглядит так ... Я не знаю, как это сделать на каком-нибудь языке, какой алгоритм читать, мне нужно немного ...

algorithm nlp arabic

вопрос задан: 11 September 2011 08:40

0

ответов

Группирование предложений по настроению

Начнем с простой задачи. Предположим, у меня есть предложение из 350 символов, и я хотел бы отнести его к категории "Хорошее настроение" или "Плохое настроение". Как лучше всего ...

algorithm nlp sentiment-analysis document-classification

вопрос задан: 9 September 2011 01:24

0

ответов

Декодирование Переставленные английские Последовательности

коллегу А недавно спросили это при попытке посадить (другую) исследовательскую работу: Учитывая 10 128 символьных строк, которые были переставлены точно таким же образом, декодируйте последовательности. Оригинал...

algorithm puzzle nlp

вопрос задан: 8 September 2011 00:37

0

ответов

NLP-программа для классификации больших наборов данных

Background В течение многих лет я использовал свои собственные байесовские методы для классификации новых элементов из внешних источников на основе большого и постоянно обновляемого набора обучающих данных. Существует три типа ...

nlp nltk

вопрос задан: 30 August 2011 19:00

0

ответов

Обнаружение глаголов Javascript

У меня следующая проблема. Мне нужно найти глаголы в строке с помощью JavaScript. Я хотел бы знать, есть ли что-то вроде (JAWS), Java API для Wordnet, но для JavaScript. Точнее ...

javascript nlp

вопрос задан: 28 August 2011 20:49

0

ответов

Применение SVD мгновенно выдает ошибку памяти?

Я пытаюсь применить SVD к моей матрице (3241 x 12596), полученной после некоторой обработки текста (с конечной целью выполнения латентного семантического анализа), и я не могу понять, почему это происходит. ..

python memory numpy nlp scipy

вопрос задан: 22 August 2011 06:28

0

ответов

Сравнение двух английских строк на предмет сходства

Итак, вот моя проблема. У меня есть два абзаца текста, и мне нужно посмотреть, похожи ли они. Не в смысле строковых показателей, а в смысле. Следующие два абзаца связаны, но мне нужно ...

algorithm text comparison nlp compare

вопрос задан: 17 August 2011 00:35