1
ответ

Получить список всех слов, которые могут быть связаны с конкретным [дублированием]

Мне было интересно, можно ли получить список более длинных слов, которые могут быть связаны с одним и тем же словом. В основном у нас есть список слов, которые мы могли бы сделать, и мы хотели бы создать новый корпус со всеми ...
вопрос задан: 23 July 2015 19:30
1
ответ

NLTK POS_TAG не работает должным образом в некоторых словах [дубликат]

Через интеллектуальную обработку текста я столкнулся с несколькими проблемами в отношении метки в NLTK. Скажем, вы вставляете прилагательное, такое как осторожное, неосторожное, полезное ... Выход всегда NN / NOUN. Есть ли способ, которым я ...
вопрос задан: 16 June 2015 00:12
1
ответ

NLTK показывает грамматически неправильные теги, какими будут правильные теги POS? [Дубликат]

Какими будут теги POS для: Бедные могут делать помидоры. NLTK показывает грамматически неправильные теги: [('The', 'DT'), ('poor', 'JJ'), ('can', 'MD'), ('can', 'MD'), ('can ',' MD '), (' ',' DT '), (' ...
вопрос задан: 16 June 2015 00:12
1
ответ

NLTK для определения существительного [дубликат]

Я планирую построить интерфейс, который идентифицирует часть / вещь, которая «заменена» / «исправлена» / «сломана». Например, (Замена цепи синхронизации заменяется на 75 км., Ответ: «Крышка цепи синхронизации») (. ..
вопрос задан: 16 June 2015 00:12
1
ответ

NLTK контекстная свободная грамматика - взять значение RHS в LHS с каким-то подстановочным знаком? [Дубликат]

Подумайте, я хочу запросить базу данных фильмов, где NL-запрос: «Покажи мне все фильмы в главной роли». Я не хочу создавать произведение для каждого возможного актера. Я могу построить грамматику для обработки "...
вопрос задан: 7 February 2015 12:25
1
ответ

Я хочу, чтобы токенизировать некоторый текст, используя nltk, но он показывал ошибку? [Дубликат]

Мой код приведен ниже. Код: import nltk из nltk.tokenize import sent_tokenize, word_tokenize short_pos = open ("/ positive.txt", "r"). Read () short_neg = open ("/ negative.txt", "r"). Read () ...
вопрос задан: 14 August 2014 19:52
1
ответ

добавление другого языка в пакет nltk.stopwords [duplicate]

Я хочу добавить еще один язык в список языков в nltk.stopwords Любой знает, как это сделать или может сообщить мне ссылку, где можно найти эту информацию? Спасибо!
вопрос задан: 26 January 2014 20:58
1
ответ

Свободный размеченный корпус для [закрытого] выделения именованных сущностей

Я ищу свободный размеченный корпус для системы для обучения на для Выделения именованных сущностей. Большинство из тех, которых я нахожу (как Нью-Йорк таймс одна) является дорогим и не открытым. Кто-либо может помочь?
вопрос задан: 9 September 2013 20:09
1
ответ

NLTK - как узнать, какие корпуса установлены из Python?

Я пытаюсь загрузить некоторые корпуса, которые я установил с установщиком NLTK, но я получил a:>>> от nltk.corpus импортируют machado Traceback (новый вызов в последний раз): Файл" <stdin>", строка...
вопрос задан: 26 October 2012 00:09
1
ответ

Разбиение / Разложение сложных и составных предложений в nltk

Есть ли способ разложить сложные предложения на простые предложения в nltk или других библиотеках обработки естественного языка? Например: Парк такой чудесный, когда солнце садится и прохладно ...
вопрос задан: 17 August 2010 10:22
1
ответ

Каково различие между запущением скрипта из командной строки и от должностного лица () с PHP?

Я пытаюсь запустить скрипт Python с помощью должностного лица () из PHP. Моя команда хорошо работает, когда я выполняю ее непосредственно использование cmd окна, но она производит ошибку, когда я выполняю ее от должностного лица () в PHP. Мой Python...
вопрос задан: 18 February 2010 13:55
0
ответов

Создайте изящную статью из неструктурированного корпуса данных в python [в ожидании]

Я очень новичок в НЛП и машинном обучении (все еще учусь на веревках). Я имел в виду практическую проблему. У меня есть статья по информационной безопасности, которую я собираю каждые 3 дня. Мы обычно собираем данные ...
вопрос задан: 25 June 2019 19:14
0
ответов

Создание нового корпуса с помощью NLTK

Я подумал, что часто ответ на мой заголовок - пойти и прочитать документацию, но я пробежался по книге NLTK, но это не так » Я не могу дать ответ. Я новичок в Python. У меня есть куча .txt ...
вопрос задан: 9 June 2019 18:53
0
ответов

Как пропустить дальнейшую обработку после того, как фраза помечена в строке?

Я ищу текст и маркирую выражения. Проблема в том, что я не знаю, как помешать поиску фраз найти более мелкие фразы внутри более длинных. Например, если мой код находит что ...
вопрос задан: 19 April 2019 20:42
0
ответов

Orange против NLTK для классификации контента в Python [закрыто]

Нам нужен модуль классификации контента. Байесовский классификатор - это то, что я ищу. Что делать: Orange или NLTK?
вопрос задан: 10 April 2019 21:34
0
ответов

Реализация пакета -of -Наивный байесовский классификатор слов -Байесовский классификатор в NLTK

У меня в основном тот же вопрос, что и у этого парня. Пример в книге NLTK для наивного байесовского классификатора рассматривает только то, слово встречается в документе как функция.. оно не учитывает...
вопрос задан: 10 April 2019 21:33
0
ответов

Сохранение обученного наивного байесовского классификатора в NLTK

Я немного запутался в том, как сохранить обученный классификатор. Например, пере-обучение классификатора каждый раз, когда я хочу его использовать, очевидно, очень плохо и медленно, как мне сохранить его и снова загрузить...
вопрос задан: 10 April 2019 21:00
0
ответов

Точность тегов TextBlob и NLTK POS

Пока у меня есть этот код ниже из textblob import TextBlob class BrinBot: def __init __ (self, message): # Принимает сообщение от пользователя в качестве аргумента parse (message) class parse: ...
вопрос задан: 24 March 2019 18:19
0
ответов

Огромный недостаток движка Stanford NER заключается в том, что он не объединяет названия одной сущности. Какой может быть подход к этому

Вот код, который я написал для пометки: sn = StanfordNERTagger ("/ home / ikscare / Documents / Projects / Mousam / stanford-ner-2014-08-27 / classifiers / english.all.3class.distsim.crf.ser .gz ", ...
вопрос задан: 22 March 2019 14:20
0
ответов

Обнаружение экономического события на французском корпусе

На самом деле работа над проектом - это обнаружение экономического события из французского корпуса. У меня есть более 10000 корпусов, которые я собирал в газете, и каждый корпус говорит о компании. для каждого ...
вопрос задан: 18 March 2019 16:31
0
ответов

Как получить тропонимы из Word Net?

Корпус Word Net NLTK, вероятно, не обеспечивает функциональность тропонима. Есть ли другой способ получить тропонимы глагола, не загружая всю базу данных. Как API или какая-то другая библиотека для ...
вопрос задан: 18 March 2019 11:47
0
ответов

Разница между НЛТК и Скикитом Наивным Байесом

Могу ли я узнать, какова природа Наивного Байеса из НЛТК? Бернулли, полиномиальный, гауссовский или любой другой вариант? Я прочитал документацию, но она кажется слишком общей. Я это понимаю ...
вопрос задан: 14 March 2019 03:10
0
ответов

Классификация текста с двумя словами

Я пытаюсь сделать извлечение ключевой информации, используя NLTK и слово tokenization в рекламных объявлениях. Например: «Максимальная вместимость номера - 800 человек. Курение запрещено, дети старше 12 лет ...
вопрос задан: 11 March 2019 21:16
0
ответов

Получение TypeError: объект 'list' не вызывается при использовании понимания в библиотеке Python NLTK?

Привет я получаю этот список объектов не вызывается в коде ниже. Я посмотрел пару похожих сообщений здесь, проблема в этом коде, кажется, другая. Может ли кто-нибудь помочь мне понять, что я не так ...
вопрос задан: 11 March 2019 14:06
0
ответов

Создайте облако слов, чтобы показать частоты чисел в Python

У меня есть датафрейм панды, который состоит из баллов студентов. Я хочу создать облако слов или облако чисел для оценок. Есть ли способ добиться этого. Я перепробовал все возможные способы, но ...
вопрос задан: 7 March 2019 21:14
0
ответов

Как исправить ошибки маркировки POS?

В настоящее время у меня есть текстовый файл, содержащий несколько сотен слов, которые я пытаюсь пометить в Python. Файл содержит уже размеченные слова. При применении pos-tag к этим словам, большинство из них ...
вопрос задан: 21 February 2019 03:14
0
ответов

Нумерация в Sentiwordnet

Кто-нибудь знает, что означают числа после объективности, предоставляемой набором настроений? Некоторые слова, которые возвращаются, являются глаголами, но имеют различные числа, такие как v.01 или v.03, как показано в ...
вопрос задан: 19 January 2019 04:31
0
ответов

При установке nltk нет модуля с именем nltk.text

Я пытался установить NLTK, и я использую Atom. Я использовал код "pip install nltk" в моем терминале. Но всегда есть ошибка. Я пробовал "pip install nltk" и "pip3 install nltk", и это не работает. Я ...
вопрос задан: 17 January 2019 03:00
0
ответов

Как исправить ошибку импорта NLTK Стэнфорда в Python

Я пытаюсь импортировать stanford ner, но получаю сообщение об ошибке: NLTK не удалось найти файл C: / Users /.../ stanford-ner-2018-10-16 / classifiers / all.7class.distsim.crf.ser! Использовать программное обеспечение ...
вопрос задан: 16 January 2019 07:54
0
ответов

Как узнать частоту употребления слова на английском языке с помощью WordNet?

Есть ли способ узнать частоту использования слова слово на английском языке с использованием WordNet или NLTK с использованием Python? ПРИМЕЧАНИЕ. Мне не нужен подсчет частоты слова в данном входном файле. Я хочу ...
вопрос задан: 12 November 2018 05:38