0
ответов

Как сделать разборы зависимости в NLTK?

Проходя через книгу NLTK, неясно, как генерировать дерево зависимости от данного предложения. Соответствующий раздел книги: суб-глава на грамматике зависимости дает пример фигуры, но он ...
вопрос задан: 25 September 2018 17:05
0
ответов

Каковы алгоритмы, стоящие за & ldquo; Broad Match & rdquo; в Google AdWords?

В настоящее время у меня есть набор из 200 тыс. Фраз. Для входной фразы я хочу найти похожие фразы всякий раз, когда кто-то ищет эту фразу, похожие фразы, единственные или множественные формы, орфографические ошибки, синонимы, ...
вопрос задан: 13 July 2018 22:24
0
ответов

Объединение относительных выражений времени в NLP в python?

Я работаю над извлечением дат из текстов на естественном языке, и мне интересно, что может быть самым эффективным способом сделать следующее: у меня есть записи в журнале с датами в качестве заголовков, извлеченных как ...
вопрос задан: 13 July 2018 12:15
0
ответов

Извлечение информации из свободного текста

Я работаю над созданием экстрактора информации, который должен использовать несколько кадров, чтобы тренироваться, чтобы выплескивать необходимую информацию из свободного текста. В чем проблема? ...
вопрос задан: 13 July 2018 10:18
0
ответов

R-неструктурированные результаты API Rosette для структурирования с хорошей точностью

В настоящее время я работаю с данными набора данных офицера / ключевого контакта. Я отправляю URL-адрес API Rosette (обнаруживает сущности). Данные возвращаются к разным объектам с их позициями. ...
вопрос задан: 13 July 2018 09:26
0
ответов

Как реализовать NLP в Xamarin Android? Я не могу найти SDK и надлежащую документацию?

Я хочу реализовать тип «Хорошо, Google» в Xamarin Android, но я не могу найти SDK или библиотеку для ее реализации. Я хочу создать приложение, которое принимает мою голосовую команду и перемещается ...
вопрос задан: 13 July 2018 08:16
0
ответов

В модели, основанной на распознавании / поиске, как обрабатывать инструкцию с несколькими вопросами для чата-бота

Я создаю дискриминационного бота домена, который получает ответы на основе частоты появления, но что, если в заданном вопросе есть несколько вопросов в нем. Как я должен справиться с этим?
вопрос задан: 13 July 2018 07:40
0
ответов

Анализ тональности объекта (Анализ тональности на уровне сущности)

Я работаю над анализом тональности на уровне документа уже год.Анализ тональности на уровне документа обеспечивает тональность всего документа. Например, текст «Nokia хорош, но…
вопрос задан: 19 April 2018 04:33
0
ответов

определение языка

Я использую tesseract для распознавания текста, в основном на счетах. Однако tesseract требует указать язык перед началом обработки файла. Я думал, что собираюсь выполнить ocr на основе предопределенного ...
вопрос задан: 25 January 2018 17:36
0
ответов

Преобразование китайских иероглифов в ханьюй пиньинь

Как преобразовать китайские иероглифы в ханьюй пиньинь? Например, 你 -> Nǐ 马 -> Mǎ Дополнительная информация: Допустимы акценты или числовые формы ханью пиньинь, я предпочитаю числовую форму. ...
вопрос задан: 16 January 2018 08:20
0
ответов

Исключение нулевого указателя с OpenNLP в классе NameFinderME

Я использую OpenNLP для извлечения именованных объектов из заданного текста. Это дает мне следующую ошибку при запуске кода на больших данных. Когда я запускаю его на небольших данных, он работает нормально. java.lang ....
вопрос задан: 27 December 2017 13:11
0
ответов

Использование PhraseMatcher в SpaCy для поиска нескольких типов совпадений

Документация и примеры SpaCy показывают, что класс PhraseMatcher полезен для сопоставления последовательностей токенов в документах. Нужно предоставить словарь последовательностей, которые будут сопоставлены. В моем ...
вопрос задан: 4 December 2017 17:40
0
ответов

Что NLTK POS tagger просит меня загрузить?

Я только начал использовать часть речи, и у меня много проблем. Я начал тегирование POS следующим образом: import nltk text = nltk.word_tokenize («Мы уходим. Только ты и я.») Когда ...
вопрос задан: 28 November 2017 03:24
0
ответов

База данных для проекта НЛП [закрыто]

Может кто-нибудь посоветовать, какая база данных лучше для хранения текстовой информации, такой как часть речевых последовательностей, зависимостей, предложений, используемых в проекте NLP, написанном на python. Теперь эта информация ...
вопрос задан: 22 September 2017 17:48
0
ответов

Есть ли база данных, API или анализируемый текст для получения спряжения глаголов?

Это не напрямую вопрос программирования, поэтому заранее прошу прощения. Я работал над генератором случайных предложений без грамматики для игры с набором текста, которую я хотел бы создать, и у меня был ...
вопрос задан: 23 May 2017 12:33
0
ответов

Python: кластеризация ключевых слов поисковой системы

Python: кластеризация ключевых слов поисковой системы Привет! У меня есть CSV, до 20 000 строк (у меня было более 100 000 для разных веб-сайтов), каждая строка содержит ключевое слово, на которое ссылается (то есть ключевое слово, которое кто-то набрал .
вопрос задан: 23 May 2017 12:32
0
ответов

Разделение строки, содержащей буквы и цифры, не разделенные каким-либо конкретным разделителем в PHP

В настоящее время я разрабатываю веб-приложение для получения потока Twitter и пытаюсь создать обработку естественного языка самостоятельно. Поскольку мои данные из Twitter (ограничены 140 символами ), есть...
вопрос задан: 23 May 2017 12:30
0
ответов

Регулярное выражение для соответствия размерам объекта

Скажу прямо: я ужасен с регулярными выражениями. Я пытался придумать один, чтобы решить мою проблему, но я действительно мало о них знаю. . . Представьте себе несколько предложений по ...
вопрос задан: 23 May 2017 12:29
0
ответов

Как алгоритм актуальных тем Твиттера решает который слова извлечь из твитов?

Я видел этот вопрос, который фокусируется на проблеме "Brittney Spears". Но у меня есть определенный другой вопрос. Как алгоритм определяет, какие слова или фразы должны быть оценены? Для...
вопрос задан: 23 May 2017 12:24
0
ответов

Где я могу узнать больше об алгоритме поиска Google «Вы имели в виду»? [дубликат]

Возможный дубликат: Как вы реализуете запрос «Вы имели в виду»? Я пишу приложение, в котором мне требуются функциональные возможности, аналогичные функциям Google «Вы имели в виду?» функция, используемая при их поиске ...
вопрос задан: 23 May 2017 12:19
0
ответов

извлечение отношений с помощью NLTK

Это продолжение моего вопроса. Я использую nltk для извлечения лиц, организаций и их связей. Используя этот пример, я смог создать фрагменты лиц и организаций; однако, ...
вопрос задан: 23 May 2017 12:17
0
ответов

PHP и NLP: вложенные круглые скобки (вывод анализатора) в массив?

Хотите превратить текст с вложенными круглыми скобками во вложенный массив. Вот пример вывода парсера НЛП: (TOP (S (NP (PRP I)) (VP (VBP love) (NP (NP (DT a) (JJ big) (NN bed)) (PP (IN of) (NP (...
вопрос задан: 23 May 2017 12:17
0
ответов

Алгоритм сравнения схожести идей (в виде строк)

Рассмотрим произвольное текстовое поле, в котором записан ответ на вопрос, что вы хотите сделать перед смертью? Используя набор строк ответа (максимальная длина 240), я хотел бы как-то отсортировать и...
вопрос задан: 23 May 2017 12:17
0
ответов

Нечеткая группировка, группировка похожих слов

этот вопрос задан здесь раньше. Какова хорошая стратегия для группировки похожих слов? но четкого ответа о том, как «группировать» элементы, не дается. Решение, основанное на difflib, в основном представляет собой поиск по заданным...
вопрос задан: 23 May 2017 12:13
0
ответов

Составьте синтетическую английскую фразу, которая будет содержать 160 бит восстанавливаемой информации

У меня 160 бит случайных данных. Ради удовольствия, я хочу сгенерировать псевдоанглийскую фразу для «хранения» этой информации. Я хочу иметь возможность восстановить эту информацию из фразы. Примечание: Это ...
вопрос задан: 23 May 2017 12:11
0
ответов

Производительность NLTK

Хорошо, в последнее время я очень интересовался обработкой естественного языка: однако до сих пор я использовал C для большей части моя работа. Я слышал о NLTK и не знал Python, но мне кажется, что это довольно легко ...
вопрос задан: 23 May 2017 12:02
0
ответов

Эффективное извлечение 1-5 грамм с питоном

У меня есть огромные файлы по 3 000 000 строк, и каждая строка содержит 20-40 слов. Я должен извлечь от 1 до 5 нграмм из корпуса. Мои входные файлы представляют собой простой текстовый токен, например: это предложение в строке foo. ...
вопрос задан: 23 May 2017 12:01
0
ответов

Объединение концептуально похожих документов вместе?

Это скорее концептуальный вопрос, чем реальная реализация, и я надеюсь, что кто-то сможет прояснить это. Моя цель заключается в следующем: учитывая набор документов, я хочу сгруппировать их таким образом, чтобы документы ...
вопрос задан: 23 May 2017 12:01
0
ответов

Извлечение/опознание сущностей с помощью бесплатных инструментов при питании Lucene Index

В настоящее время я исследую возможности извлечения имен людей, мест их нахождения, технических слов и категорий из текста (много статей из сети), который затем будет введен в индекс Lucene/ElasticSearch. ...
вопрос задан: 23 May 2017 12:00
0
ответов

Существует ли язык программирования с семантикой, близкой к английской?

Большинство языков позволяют «настраивать» определенные расширенные части синтаксиса (C ++, C #) и / или семантику, которые вы захотите использовать в вашем коде (Katahdin, lua). Но я не слышал о языке, который мог бы просто ...
вопрос задан: 23 May 2017 12:00