0
ответов

Импорт WordNet в NLTK

Я хочу импортировать словарь wordnet, но когда я импортирую WordNet из словаря, я вижу эту ошибку: для l в открытом (WNSEARCHDIR + '/ lexnames'). Readlines () : IOError: [Errno 2] Нет такого файла или каталога: 'C: \ ...
вопрос задан: 12 July 2011 09:34
0
ответов

Какой классификатор выбрать в NLTK

Я хочу разделить текстовые сообщения на несколько категорий, таких как «построение отношений», «координация», «обмен информацией», «обмен знаниями» и » Решение конфликта". Я использую библиотеку NLTK, чтобы ...
вопрос задан: 5 July 2011 16:14
0
ответов

Детерминирована ли маркировка POS?

Я пытался понять, почему это происходит, но надеюсь, что кто-то сможет пролить свет на это. Я пытаюсь пометить следующий текст: ae0.475 X mod ae0.842 X mod ae0 ....
вопрос задан: 30 June 2011 21:11
0
ответов

Unrhyw un yn clywed pryd y bydd NLTK 3.0 allan?

Dywed y wefan, http://www.nltk.org, ganol 2011 yn dull annelwig iawn. Hoffwn ddechrau defnyddio NLTK ond rydw i wedi gwneud cryn dipyn o waith gyda Python 3.x ac nid wyf am orfod mynd ...
вопрос задан: 28 June 2011 03:37
0
ответов

正在从句子中提取“有用的”信息吗?

我目前正在尝试理解这种形式的句子:机顶盒的问题更多于电视。 重新启动机顶盒解决了该问题。 我对Natural完全陌生...
вопрос задан: 26 June 2011 04:59
0
ответов

Модель языка nltk (ngram) вычисляет вероятность слова из контекста

Я использую Python и NLTK для построения языковой модели следующим образом: from nltk.corpus import brown из nltk.probability import LidstoneProbDist, WittenBellProbDist Estimator = lambda fdist, bins: ...
вопрос задан: 24 June 2011 16:12
0
ответов

Использование python nltk для поиска сходства между двумя веб-страницами?

Я хочу выяснить, похожи ли две веб-страницы или нет. Может ли кто-нибудь подсказать, полезен ли python nltk с функциями сходства wordnet и как? Какую функцию подобия лучше всего использовать в этом ...
вопрос задан: 6 June 2011 12:47
0
ответов

Английская грамматика для синтаксического анализа в NLTK

Есть ли готовая к использованию английская грамматика, которую я могу просто загрузить и использовать в NLTK? Я искал примеры синтаксического анализа с помощью NLTK, но похоже, что мне нужно вручную указать грамматику перед ...
вопрос задан: 24 May 2011 19:26
0
ответов

Python NLTK: Как сделать Помечать предложения с помощью упрощенного набора тегов части речи?

Глава 5 книги Python NLTK дает следующий пример пометки слов в предложении: >>> text = nltk. >>> nltk.pos_tag (...
вопрос задан: 26 April 2011 08:19
0
ответов

Распознавание именованных сущностей для NLTK в Python. Идентификация NE

мне нужно классифицировать слова по частям речи. Как глагол, существительное, наречие и т. Д. Я использовал nltk.word_tokenize () # для определения слова в предложении nltk.pos_tag () # чтобы идентифицировать части ...
вопрос задан: 18 April 2011 20:14
0
ответов

Фильтр шаблона POS?

Я написание кода, который повторяет набор тегов POS (сгенерированных pos_tag в NLTK) для поиска шаблонов POS. Соответствующие наборы POS-тегов сохраняются в списке для последующей обработки. Конечно, регулярное выражение -...
вопрос задан: 12 April 2011 01:49
0
ответов

Python NLTK против связанных библиотек Java? [закрыто]

Я использовал LingPipe, Stanford's NER, RiTa и различные библиотеки подобия предложений для своих предыдущих проектов Java, которые были сосредоточены на (предварительной) обработке текста (индексация, теги xml, определение тем и т. д.) ...
вопрос задан: 8 April 2011 01:52
0
ответов

как использовать алгоритм Гейла-Черча в Python-NLTK?

Алгоритм штормовой церкви доступен в python-NLTK, но может ли кто-нибудь показать мне пример того, как вызвать функцию в сценарии python? Я понятия не имею, как это сделать. http: //code.google ....
вопрос задан: 6 April 2011 09:18
0
ответов

Python: Токенизация с помощью фраз

У меня есть блоки текста, которые я хочу токенизировать, но Я не хочу использовать пробелы и знаки препинания для токенизации, что, по-видимому, является стандартом для таких инструментов, как NLTK. Есть определенные фразы, которыми я хочу быть ...
вопрос задан: 3 April 2011 20:56
0
ответов

Удаление знаков препинания / чисел из текстовой проблемы

У меня был код, который отлично работал с удалением знаков пунктуации / чисел с помощью регулярных выражений в Python, мне пришлось немного изменить код, чтобы стоп-лист сработал, не особо важно. В любом случае, теперь ...
вопрос задан: 1 April 2011 11:32
0
ответов

Добавление слов в список стоп-слов nltk

У меня есть код, который удаляет стоп-слова из моего набора данных, так как стоп-лист, похоже, не удаляет большинство слов, которые мне бы тоже хотелось, я ищу добавить слова в этот стоп-список, чтобы он ...
вопрос задан: 1 April 2011 09:49
0
ответов

Стоп-слова Проблема nltk / python

У меня есть код, который обрабатывает набор данных для последующего использования, код, который я использую для стоп-слов, кажется нормальным, но я думаю, что проблема заключается в остальной части моего кода, поскольку он, кажется, только удаляет ...
вопрос задан: 31 March 2011 12:16
0
ответов

Как создать систему тегов, как в Stack Overflow или Quora

Я хочу создать систему тегов, как показано здесь, в Stack Overflow или на Quora. Это будет собственная модель, и я m планирую использовать этот плагин автозаполнения, чтобы помочь пользователям находить теги. У меня есть пара ...
вопрос задан: 30 March 2011 23:10
0
ответов

Лемматизация слов с тегами POS с помощью NLTK?

У меня есть теги POS для некоторых слов с помощью nltk.pos_tag (), поэтому им присваиваются теги дерева. Я хотел бы лемматизировать эти слова, используя известные теги POS, но я не уверен, как это сделать. Я смотрел Wordnet ...
вопрос задан: 23 March 2011 19:19
0
ответов

Чтобы найти количество слогов в слове

, мне нужно узнать количество слогов в слове английского языка с помощью NLTK. Вот код, который у меня есть: import curses из curses.ascii import isdigit import nltk от nltk ....
вопрос задан: 23 February 2011 05:55
0
ответов

Как подсчитать количество предложений, слов и символов в файле?

Я написал следующий код для токенизации входного абзаца, полученного из файла samp. текст. Может ли кто-нибудь помочь мне найти и распечатать количество предложений, слов и символов в файле? ...
вопрос задан: 22 February 2011 05:54
0
ответов

Как постепенно обучать классификатор nltk

Я работаю над проектом по классификации фрагментов текста с использованием модуля python nltk и классификатора naivebayes. Я могу обучаться на данных корпуса и классифицировать другой набор данных, но хотел бы ...
вопрос задан: 5 February 2011 05:50
0
ответов

Объединение токенизатора в грамматику и парсера с NLTK

Я просматриваю книгу NLTK и не могу что-то сделать это может показаться естественным первым шагом к построению хорошей грамматики. Моя цель - построить грамматику для определенного ...
вопрос задан: 1 February 2011 03:06
0
ответов

PyPy работает с NLTK?

Работает ли PyPy с NLTK, и если да, есть ли заметное улучшение производительности, скажем, для байесовского классификатора? Пока мы находимся в этом, сделайте любую из других сред python (shedskin, и т. Д.) ...
вопрос задан: 31 January 2011 17:44
0
ответов

Как быстрее подсчитывать слова в nltk plaintextcorpus?

У меня есть набор документов, и я хочу вернуть список кортежей, где каждый кортеж имеет дату данного документа и количество раз, когда данный поисковый запрос встречается в этом документе. Мой код (ниже) ...
вопрос задан: 11 January 2011 05:44
0
ответов

Эффективный контекстно-свободный синтаксический анализатор грамматики, предпочтительно совместимый с Python

Мне нужно разобрать небольшое подмножество английского языка для одного из моих проектов, описанного как контекстно-свободная грамматика с ( 1-уровневые) структуры функций (пример), и мне нужно сделать это эффективно. Прямо сейчас я '...
вопрос задан: 28 December 2010 01:06
0
ответов

Пытаетесь использовать MEGAM в качестве NLTK ClassifierBasedPOSTagger?

В настоящее время я пытаюсь создать универсальный (или настолько общий, насколько это практически возможно) POS-теггер с NLTK. Я баловался коричневым корпусом и корпусом treebank для обучения, но, вероятно, остановлюсь на ...
вопрос задан: 17 December 2010 02:29
0
ответов

Устранение неоднозначности слов в NLTK Python

I Я новичок в NLTK Python, и я ищу пример приложения, которое может устранять неоднозначность слов. У меня много алгоритмов в результатах поиска, но нет примера приложения. Я просто хочу ...
вопрос задан: 14 September 2010 13:41
0
ответов

В чем разница между закрытием ввода / OutputStream и непосредственное закрытие Socket?

Мне просто интересно, что делает java, когда мы вызываем close для inputStream и outStream, связанных с сокетом. В чем отличие от вызова close на сокете, т.е. Socket.close (). если мы просто ...
вопрос задан: 7 August 2010 00:57