13
ответов

Как избежать вычисления каждый раз, когда модуль Python перезагружается

У меня есть модуль Python, который использует огромную глобальную переменную словаря, в настоящее время я помещал код вычисления в главный раздел, в каждый первый раз, когда импорт или перезагрузка модуля берут более затем один...
вопрос задан: 10 January 2009 18:37
12
ответов

NLTK Невозможно скачать правильно [64-бит] [дублировать]

Отказ от ответственности: я знаю, что аналогичный вопрос уже задан, но решение не сработало, и вопрос касался «nltk.download ()», тогда как я использую «nltk.download (популярный)». У меня есть Python ...
вопрос задан: 7 March 2014 00:12
12
ответов

Как установить Tokenizer Punkt Sentence [duplicate]

Я сталкиваюсь с моделью: Punkt Sentence Tokenizer, но не знаю, как ее установить. Не могли бы вы предоставить мне помощь. благодаря
вопрос задан: 7 March 2014 00:12
11
ответов

nltk StanfordNERTagger не работает [дублировать]

Вот код python: из nltk.tag import StanfordNERTagger st = StanfordNERTagger ('D: /stanford-ner-2018-02-27/classifiers/english.all.3class.distsim.crf.ser.gz', 'D: / Стэнфорд-нер -...
вопрос задан: 6 December 2015 06:28
11
ответов

NLTK не смог найти stanford-ner.jar! Установите переменную среды CLASSPATH [duplicate]

Я столкнулся с ошибкой. Я пытаюсь создать автоматизированные вопросы из данных документов. Вопросы будут похожи на вопросы с несколькими вариантами выбора. Вот мой код: import os import sys import nltk import ...
вопрос задан: 6 December 2015 06:28
9
ответов

Как установить nltk [duplicate]

Я новичок в python, я использую Windows 10, и мне в основном нужно использовать nltk для моего проекта, но мне кажется, что этот массаж ошибок выглядит следующим образом: Traceback (последний последний вызов): Файл «& lt; pyshell # 0 & gt;», линия 1, ...
вопрос задан: 25 November 2014 00:17
8
ответов

Не удалось установить CoreNLPNERTagger [дубликат]

Недавно я использовал CoreNLPNERTagger, модуль, присутствующий в NLTK. Я создал новую среду и попытался ее использовать, но она не работает. Я получаю ошибку импорта модуля. Запустите Core NLP-сервер от ...
вопрос задан: 6 December 2015 06:28
7
ответов

Как удалить слова из списка Nltk stoplist [duplicate]

Я хочу удалить несколько слов, из слов удалить слова, упоминание в новых словах, я проверяю метод расширения и добавления, который работает хорошо, но как удалить? от nltk.corpus import wordnet, стоп-слова ...
вопрос задан: 6 March 2013 13:53
6
ответов

NLTK word Lemmatizer странное поведение - помощь в пометке POS - Python 3 [дубликат]

Пытался написать небольшую программу анализа настроений в python3. Но, работая со словом lemmatizer, увидел, что странное преобразование «было» в «wa» было совершенно неожиданным. Ниже приведено мое ...
вопрос задан: 23 March 2013 14:23
5
ответов

NLTK: слово & ldquo; a & rdquo; не удаляться как секундомер [дубликат]

По какой-то причине я не могу удалить «a» из строки. Я вижу, что NLTK уже имеет «a» в списке стоп-слов, но код, который я написал, все еще возвращал это слово. Затем я попытался добавить «а» еще раз ...
вопрос задан: 2 October 2013 09:46
5
ответов

Генерация случайных предложений из пользовательского текста в NLTK Python?

Я испытываю затруднения из-за NLTK в соответствии с Python, конкретно .generate () метод. генерируйте (сам, length=100) Печать случайный текст, сгенерированное использование триграммной языковой модели. Параметры:...
вопрос задан: 19 July 2009 20:20
4
ответа

Как извлечь распространенный / значительные фразы от ряда вводов текста

У меня есть серия текстовых объектов - необработанный HTML от базы данных MySQL. Я хочу найти наиболее распространенные фразы в этих записях (не единственная наиболее распространенная фраза, и идеально, не осуществляя слово в слово...
вопрос задан: 26 November 2017 10:40
4
ответа

Что такое “энтропийное и увеличение информации”?

Я читаю эту книгу (NLTK), и это сбивает с толку. Энтропия определяется как: Энтропия является суммой вероятности каждой маркировки времена вероятность журнала того же самого маркировала How, я могу подать заявку...
вопрос задан: 1 September 2016 06:17
4
ответа

ошибка модуля python nltk [дубликат]

import nltk text = «Python - это интерпретируемый язык программирования высокого уровня для программирования общего назначения. Созданный Guido van Rossum и впервые выпущенный в 1991 году». sentences = nltk.sent_tokenize (...
вопрос задан: 8 March 2016 14:37
4
ответа

NLTK WordNet Lemmatizer: Разве это не должно лемматизировать все склонения слова?

Я использую NLTK WordNet Lemmatizer для проекта тегирования части речи, сначала модифицируя каждое слово в учебном корпусе до его основы (на месте модификации), а затем тренируюсь только на новом ...
вопрос задан: 12 April 2015 15:24
4
ответа

Как получить лексические тексты для данного слова в python, используя nltk [duplicate]

У меня есть текст вроде my_text = «Билл». Мне нужны лексические тексты для моей строки, мой желаемый результат - my_output = [«Билл», «Биллинг», «Счет»)
вопрос задан: 12 April 2015 15:20
4
ответа

Java или распределенный Python вычисляют задание (на студенческом бюджете)?

У меня есть большой набор данных (c. 40G), что я хочу использовать для некоторой обработки естественного языка (в основном смущающе параллельный) по нескольким компьютерам в лаборатории, к которой у меня нет корневого доступа и только 1G пространства поль
вопрос задан: 16 May 2010 14:28
4
ответа

поколение тега от текстового содержания

Мне любопытно, если существует алгоритм/метод, существует для генерации ключевых слов/тегов из данного текста, при помощи некоторых расчетов веса, отношения возникновения или других инструментов. Кроме того, я буду благодарен...
вопрос задан: 18 April 2010 23:02
4
ответа

как я пользуюсь библиотеками Python в C++?

Я хочу пользоваться nltk библиотеками в C++. Существует ли язык/механизм связующего звена, который я могу использовать, чтобы сделать это? Причина: Я не сделал никакого серьезного программирования в C++ некоторое время и хочу пересмотреть понятия обработк
вопрос задан: 17 November 2008 22:18
3
ответа

Классификация документов в категории

Я имею о 300k документах, хранивших в базе данных Postgres, которые отмечены с категориями темы (существует приблизительно 150 категорий всего). У меня есть другой 150k документы, которые еще не имеют...
вопрос задан: 10 April 2019 21:32
3
ответа

Чтение текста корпуса с помощью nltk.corpus.reader.plaintext - Python 3 [duplicate]

Я использую модуль NLTK.corpus в Python (3.6.3) для построения и анализа созданного мною корпуса. Этот корпус состоит из нескольких сотен документов. Чтобы получить доступ к содержимому документа в корпусе, ...
вопрос задан: 22 January 2015 00:16
3
ответа

Python и интеграция.NET

Я в настоящее время смотрю на Python, потому что мне действительно нравится текст, анализирующий возможности и nltk библиотеку, но традиционно я - программист.Net/C#. Я не думаю, что IronPython является точкой интеграции...
вопрос задан: 12 January 2015 03:52
3
ответа

Загрузка пакета punkt в / Users / macbook / nltk_data & hellip; замораживает [дубликат]

Я пытаюсь установить TextBlob на Python 3.6.5. Все идет отлично, пока я не использовал эту командную строку: python3 -m textblob.download_corpora, и она начала загружать пакет коричневого цвета и пакет ...
вопрос задан: 23 January 2014 16:37
3
ответа

Я могу использовать NLTK, чтобы определить, является ли комментарий положительным или отрицательным?

Можно ли показать мне простой пример с помощью http://www.nltk.org/code, чтобы определить если строка о счастливом настроении или настроении нарушения?
вопрос задан: 11 August 2010 22:25
3
ответа

Как определить идеи и понятия в данном тексте

Я работаю над проектом в данный момент, где было бы действительно полезно смочь обнаружить, когда определенная тема/идея упоминается в теле текста. Например, если текст содержал: Возможно, если...
вопрос задан: 18 May 2010 09:45
3
ответа

Как выбрать Feature Selection Algorithm? - совет

Есть ли научно-исследовательская работа / книга, которую я могу прочитать, который может сказать мне для проблемы под рукой, какой алгоритм выбора функции работал бы лучше всего. Я пытаюсь просто определить сообщения Твиттера как...
вопрос задан: 14 January 2010 16:51
3
ответа

каково истинное различие между лемматизацией по сравнению со стеммингом?

Когда я использую каждого? Также... действительно ли лемматизация NLTK зависит от Частей речи? Разве не было бы более правильно, если бы это было?
вопрос задан: 24 November 2009 00:48
3
ответа

Использование NLTK Python (2.0b5) на Google App Engine

Я пытался сделать NLTK (Инструментарий естественного языка) работой над Google App Engine. Шаги, которые я выполнил: Загрузите установщик и выполните его (.dmg файл, поскольку я использую Mac). скопируйте...
вопрос задан: 17 August 2009 12:06
2
ответа

NLTK. Пункт не найден

Как следует из названия, пункт не найден. Конечно, я уже импортировал nltk и nltk.download («все»). Это все еще ничего не решает, и я все еще получаю эту ошибку: Тип исключения: ...
вопрос задан: 22 March 2019 10:07
2
ответа

Триграммы Python для кортежа

У меня есть триграмма как trigrm = [((w1, tag1), (w2, tag2), (w3, tag3))] Я хотел бы извлечь только теги каждого слова из триграммы выше в кортеже, как tup = (tag1, tag2, tag3)
вопрос задан: 16 January 2019 12:31