У меня есть список Python, как показано ниже: documents = ["Human машинный интерфейс для лабораторных компьютерных приложений abc »,« Обзор мнения пользователей о времени отклика компьютерной системы »,« ...
Я пытаюсь создать интерфейс для моего инструмента для запросов из семантической / реляционной БД с использованием C # .NET Я сейчас мне нужен слой над уровнем запроса для преобразования входных данных NL в SQL / SPARQL, я прочитал ...
Например, у меня есть миллиарды коротких фраз, и я хочу собрать их похожие группы. > strings.to.cluster <- c («Лучший дилер Toyota в районе отсека. Уезжайте сегодня на новой машине», ...
Я пытаюсь извлечь данные из нескольких больших текстовых файлов, содержащих записи о людях. Однако проблема в том, что я не могу контролировать способ получения данных. Обычно он имеет следующий формат: ...
В настоящее время я прохожу курс обработки естественного языка в своем университете и все еще путаюсь в некоторых основных понятиях. Я получил определение POS Tagging из книги "Основы статистической обработки естественного ...
Есть ли способ найти все Подпредложения предложения, которые по-прежнему имеют смысл и содержат по крайней мере одно подлежащее, глагол и сказуемое / объект? Например, если у нас есть предложение типа «Я ...
Я пытаюсь обойтись с помощью Stanford CoreNLP. Я использовал некоторый код из Интернета, чтобы понять, что происходит с инструментом coreference. Я пробовал запустить проект в Eclipse, но продолжаю ...
Я хочу, чтобы пользователь мог вводить задачу, и я поставлю ей соответствующий префикс так, чтобы он имел правильную структуру предложения. Например. Я работаю над [сделать мир лучше] ... звучит хорошо. Я ...
Можно ли где-нибудь скачать Treebank английских фраз бесплатно или менее чем за 100 долларов? Мне нужны обучающие данные, содержащие кучу синтаксически проанализированных предложений (> 1000) на английском языке в любом формате. В основном все ...
Мне нужно вычислить частоту слов заданного набора прилагательных в большом наборе отзывов службы поддержки клиентов. Однако я не хочу включать те прилагательные, которые отрицаются. Например, предположим, что мой список ...
Я хочу узнать, в нескольких языках, являются ли два слова: либо одним и тем же словом,
либо грамматическими вариантами одного и того же слова. Например: had и has имеют одну и ту же основу: в обоих случаях это глагол ...
Я новичок в NTLK / Python, и мне удалось загрузить свой собственный корпус с помощью CategoryizedPlaintextCorpusReader, но как я на самом деле тренируюсь и использовать данные для классификации текста? >>> from nltk ....
Я экспериментирую с elasticsearch в качестве поискового сервера, и моя задача - построить функциональность "семантического" поиска. Из короткой текстовой фразы типа "У меня прорвало трубу" система должна сделать вывод, что ...
Я хочу создать список из ~ 6 ключевых слов (или даже лучше: пары ключевых словосочетаний) для каждого сообщения на форуме сообщений. В основном ключевые слова используются для замены строк темы в некоторых случаях. Для ...
Кто-нибудь может объяснить, пожалуйста, многозадачное обучение простым и интуитивно понятным способом? Может быть какой-то настоящий
Мировая проблема была бы полезной. В основном, в наши дни я вижу, что многие люди используют ее для естественного языка
Я хочу сделать "coreference resolution" используя OpenNLP. Документация от Apache (Coreference Resolution) не описывает, как сделать "разрешение кореференции". Есть ли у кого-нибудь документация/учебник, как сделать ...
Я хотел бы сделать автоматическую маркировку семантических ролей в FrameNet Lexicon с помощью некоторой машины методы обучения. Не могли бы вы предложить мне несколько пакетов java, наиболее подходящих для этого проекта?
Общие сведения (TL; DR; предоставляется для завершения) Обращение за советом по оптимальному решению нечетного требования.
Я студент (литературный) на четвертом курсе колледжа и только под моим личным руководством ...
Я нашел ссылки на SharpNLP (порт OpenNLP на основе Java) и Antelope от Proxem. Я хочу создать полное дерево синтаксического анализа предложения (тегирование части речи) вместе с поиском имен ...
Кто-нибудь знает хорошую базу данных для спряжения глаголов? Я создаю приложение для обработки естественного языка. Хотя я мог хорошо использовать WordNet, он не позволяет мне проверять форму ...
Проект о переводе полуестественного языка в таблицы SQL. Код: label (S) -> label_h (C), {atom_codes (A, C), string_to_atom (S, A)},!. label_h ([C | D]) -> letter (C), ...
I ' Я пытаюсь придумать синтаксический анализатор для футбольных игр. Я использую термин «естественный язык» здесь очень свободно, так что, пожалуйста, потерпите меня, так как я почти ничего не знаю об этой области. Вот несколько примеров ...
Итак, я знаю, что это своего рода большая тема, но мне нужно принять кусок текста и извлечь из него наиболее интересные ключевые слова. Текст взят из телевизионных титров, поэтому тема может варьироваться от новостей ...
Это всплыло в другом вопросе, но я решил, что лучше задать это как отдельный вопрос. Дается большой список предложений (порядка 100 тысяч): [
"Это предложение 1 в качестве примера",
"Это ...
Я пытаюсь реализовать довольно тривиальную "взять результаты поиска (как в заголовке и кратком описании), сгруппировать их в значимые именованные группы »на PHP. После нескольких часов поиска в Google и ...
Мне нужен проверка орфографии со следующей спецификацией: Очень масштабируемая.
Чтобы иметь возможность установить максимальное расстояние редактирования для предлагаемых слов.
Чтобы получить предложение на основе предоставленных частот слов (...
Не могли бы вы сообщить мне некоторые из стандартных библиотек C ++, полезных для обработки крупномасштабных данных, например Обработка естественного языка с огромным набором данных, набором данных о белке белка .. .