0
ответов

Как ограничить слова в списке Python?

У меня есть список Python, как показано ниже: documents = ["Human машинный интерфейс для лабораторных компьютерных приложений abc »,« Обзор мнения пользователей о времени отклика компьютерной системы »,« ...
вопрос задан: 18 February 2012 18:36
0
ответов

.NET dll для естественного языка в SQL / SPARQL

Я пытаюсь создать интерфейс для моего инструмента для запросов из семантической / реляционной БД с использованием C # .NET Я сейчас мне нужен слой над уровнем запроса для преобразования входных данных NL в SQL / SPARQL, я прочитал ...
вопрос задан: 3 February 2012 23:38
0
ответов

как найти похожие предложения / фразы в R?

Например, у меня есть миллиарды коротких фраз, и я хочу собрать их похожие группы. > strings.to.cluster <- c («Лучший дилер Toyota в районе отсека. Уезжайте сегодня на новой машине», ...
вопрос задан: 31 January 2012 04:34
0
ответов

Обработка искаженных текстовых данных с помощью машинного обучения или NLP

Я пытаюсь извлечь данные из нескольких больших текстовых файлов, содержащих записи о людях. Однако проблема в том, что я не могу контролировать способ получения данных. Обычно он имеет следующий формат: ...
вопрос задан: 26 January 2012 03:03
0
ответов

В чем разница между POS Tagging и Shallow Parsing?

В настоящее время я прохожу курс обработки естественного языка в своем университете и все еще путаюсь в некоторых основных понятиях. Я получил определение POS Tagging из книги "Основы статистической обработки естественного ...
вопрос задан: 25 January 2012 07:07
0
ответов

Нахождение значимых субпредложений из предложения

Есть ли способ найти все Подпредложения предложения, которые по-прежнему имеют смысл и содержат по крайней мере одно подлежащее, глагол и сказуемое / объект? Например, если у нас есть предложение типа «Я ...
вопрос задан: 23 January 2012 16:49
0
ответов

Использование Stanford CoreNLP

Я пытаюсь обойтись с помощью Stanford CoreNLP. Я использовал некоторый код из Интернета, чтобы понять, что происходит с инструментом coreference. Я пробовал запустить проект в Eclipse, но продолжаю ...
вопрос задан: 23 January 2012 06:07
0
ответов

Как я могу изменить префикс предложения «Я работаю над [X]», чтобы он имел правильную структуру предложения для всех X?

Я хочу, чтобы пользователь мог вводить задачу, и я поставлю ей соответствующий префикс так, чтобы он имел правильную структуру предложения. Например. Я работаю над [сделать мир лучше] ... звучит хорошо. Я ...
вопрос задан: 21 January 2012 12:15
0
ответов

Есть ли бесплатный Treebank? [закрыто]

Можно ли где-нибудь скачать Treebank английских фраз бесплатно или менее чем за 100 долларов? Мне нужны обучающие данные, содержащие кучу синтаксически проанализированных предложений (> 1000) на английском языке в любом формате. В основном все ...
вопрос задан: 21 January 2012 00:14
0
ответов

Техника вычисления частоты прилагательных

Мне нужно вычислить частоту слов заданного набора прилагательных в большом наборе отзывов службы поддержки клиентов. Однако я не хочу включать те прилагательные, которые отрицаются. Например, предположим, что мой список ...
вопрос задан: 16 January 2012 01:31
0
ответов

Как узнать, имеют ли два слова одну и ту же основу?

Я хочу узнать, в нескольких языках, являются ли два слова: либо одним и тем же словом, либо грамматическими вариантами одного и того же слова. Например: had и has имеют одну и ту же основу: в обоих случаях это глагол ...
вопрос задан: 13 January 2012 19:46
0
ответов

Использование моего собственного корпуса для классификации категорий в Python NLTK

Я новичок в NTLK / Python, и мне удалось загрузить свой собственный корпус с помощью CategoryizedPlaintextCorpusReader, но как я на самом деле тренируюсь и использовать данные для классификации текста? >>> from nltk ....
вопрос задан: 11 January 2012 11:34
0
ответов

Семантический поиск с помощью NLP и elasticsearch

Я экспериментирую с elasticsearch в качестве поискового сервера, и моя задача - построить функциональность "семантического" поиска. Из короткой текстовой фразы типа "У меня прорвало трубу" система должна сделать вывод, что ...
вопрос задан: 7 January 2012 23:37
0
ответов

Алгоритм (или библиотека C #) для определения «ключевых слов» в наборе сообщений? [закрыто]

Я хочу создать список из ~ 6 ключевых слов (или даже лучше: пары ключевых словосочетаний) для каждого сообщения на форуме сообщений. В основном ключевые слова используются для замены строк темы в некоторых случаях. Для ...
вопрос задан: 3 January 2012 01:55
0
ответов

Многозадачное обучение

Кто-нибудь может объяснить, пожалуйста, многозадачное обучение простым и интуитивно понятным способом? Может быть какой-то настоящий Мировая проблема была бы полезной. В основном, в наши дни я вижу, что многие люди используют ее для естественного языка
вопрос задан: 31 December 2011 13:10
0
ответов

Coreference Resolution using OpenNLP

Я хочу сделать "coreference resolution" используя OpenNLP. Документация от Apache (Coreference Resolution) не описывает, как сделать "разрешение кореференции". Есть ли у кого-нибудь документация/учебник, как сделать ...
вопрос задан: 25 December 2011 13:11
0
ответов

Разница между распознаванием и разрешением именованного объекта?

В чем разница между распознаванием именованного объекта и разрешением разрешения именованного объекта? Был бы признателен за практический пример.
вопрос задан: 21 December 2011 20:54
0
ответов

Автоматическая маркировка семантических ролей в FrameNet

Я хотел бы сделать автоматическую маркировку семантических ролей в FrameNet Lexicon с помощью некоторой машины методы обучения. Не могли бы вы предложить мне несколько пакетов java, наиболее подходящих для этого проекта?
вопрос задан: 18 December 2011 10:09
0
ответов

Некоторые вещи НЛП, связанные с грамматикой, тегированием, выделением корней и устранением неоднозначности слов в Python

Общие сведения (TL; DR; предоставляется для завершения) Обращение за советом по оптимальному решению нечетного требования. Я студент (литературный) на четвертом курсе колледжа и только под моим личным руководством ...
вопрос задан: 16 December 2011 23:37
0
ответов

Фреймворк NLP для .NET [закрыто]

Я нашел ссылки на SharpNLP (порт OpenNLP на основе Java) и Antelope от Proxem. Я хочу создать полное дерево синтаксического анализа предложения (тегирование части речи) вместе с поиском имен ...
вопрос задан: 12 December 2011 01:09
0
ответов

База данных спряжения глаголов [закрыто]

Кто-нибудь знает хорошую базу данных для спряжения глаголов? Я создаю приложение для обработки естественного языка. Хотя я мог хорошо использовать WordNet, он не позволяет мне проверять форму ...
вопрос задан: 8 December 2011 00:52
0
ответов

Не могли бы вы порекомендовать набор инструментов NLP в Prolog?

Мне нужно разобрать или токенизировать английские предложения. Есть ли какой-нибудь инструментарий для NLP в Prolog? Спасибо.
вопрос задан: 2 December 2011 04:50
0
ответов

Проблемы с DCG Пролога

Проект о переводе полуестественного языка в таблицы SQL. Код: label (S) -> label_h (C), {atom_codes (A, C), string_to_atom (S, A)},!. label_h ([C | D]) -> letter (C), ...
вопрос задан: 26 November 2011 01:57
0
ответов

Анализатор естественного языка для анализа данных спортивных состязаний по игре

I ' Я пытаюсь придумать синтаксический анализатор для футбольных игр. Я использую термин «естественный язык» здесь очень свободно, так что, пожалуйста, потерпите меня, так как я почти ничего не знаю об этой области. Вот несколько примеров ...
вопрос задан: 20 November 2011 03:00
0
ответов

Как извлечь ключевые слова из блока текста в Haskell

Итак, я знаю, что это своего рода большая тема, но мне нужно принять кусок текста и извлечь из него наиболее интересные ключевые слова. Текст взят из телевизионных титров, поэтому тема может варьироваться от новостей ...
вопрос задан: 12 November 2011 22:08
0
ответов

Извлечь триплет подлежащее, предикат и объектное предложение

Я пытаюсь извлечь из предложения тройной субъект, предикат и объект. Мне нужно больше ссылок о том, как это сделать.
вопрос задан: 9 November 2011 10:05
0
ответов

Наиболее эффективный способ индексирования слов в документе?

Это всплыло в другом вопросе, но я решил, что лучше задать это как отдельный вопрос. Дается большой список предложений (порядка 100 тысяч): [ "Это предложение 1 в качестве примера", "Это ...
вопрос задан: 5 November 2011 01:09
0
ответов

Библиотека PHP для кластеризации слов / NLP?

Я пытаюсь реализовать довольно тривиальную "взять результаты поиска (как в заголовке и кратком описании), сгруппировать их в значимые именованные группы »на PHP. После нескольких часов поиска в Google и ...
вопрос задан: 2 November 2011 11:45
0
ответов

Максимальное расстояние редактирования и предложение на основе частоты слов

Мне нужен проверка орфографии со следующей спецификацией: Очень масштабируемая. Чтобы иметь возможность установить максимальное расстояние редактирования для предлагаемых слов. Чтобы получить предложение на основе предоставленных частот слов (...
вопрос задан: 31 October 2011 16:45
0
ответов

Стандартная библиотека C ++ для крупномасштабной обработки данных

Не могли бы вы сообщить мне некоторые из стандартных библиотек C ++, полезных для обработки крупномасштабных данных, например Обработка естественного языка с огромным набором данных, набором данных о белке белка .. .
вопрос задан: 29 October 2011 23:25