2
ответа

Подобие косинуса Векторов различных длин?

Я пытаюсь использовать TF-IDF для сортировки документов в категории. Я вычислил tf_idf для некоторых документов, но теперь когда я пытаюсь вычислить Подобие Косинуса между двумя из этих документов, я добираюсь...
вопрос задан: 23 May 2017 11:54
2
ответа

Почему нам нужно обучать PunktSentenceTokenizer? Как он проходит обучение в бэкэнд? [Дубликат]

Почему нам нужно обучать PunktSentenceTokenizer? Как он проходит обучение в бэкэнд? Какова логика обучения и как она отличается от базового Tokeniser в NLTK
вопрос задан: 22 June 2016 06:21
2
ответа

Частеречная разметка на немецком языке

Я использую NLTK для извлечения существительных из текстовой строки, запускающейся со следующей команды: tagged_text = nltk.pos_tag (nltk. Текст (nltk.word_tokenize (some_string))), Это хорошо работает на английском языке. Есть ли...
вопрос задан: 26 November 2015 16:25
2
ответа

[Закрываются] практические примеры использования NLTK

Я играю вокруг с Инструментарием естественного языка (NLTK). Его документация (Книга и ПРАКТИЧЕСКОЕ РУКОВОДСТВО) является довольно большой, и примеры иногда немного совершенствуются. Там хорошо работают, но являются основными...
вопрос задан: 30 September 2015 11:44
2
ответа

Решение для регулярных выражений английских сокращений не работает [дубликат]

В настоящее время я занимаюсь регулярными выражениями и NLTK (Natural Language Toolkit). Я хочу выражать предложения в словах и пунктуации. Схватки вроде «не могу», «я сделаю» и т. Д. ...
вопрос задан: 10 August 2015 16:01
2
ответа

& lt; генераторный объект & lt; ген xpr & gt; при 0x11ad5dbf8 & gt; вместо словных стеблей? [Дубликат]

Следующий код должен выводить слова стека, но вместо этого я получаю объект-генератор. из nltk.stem import SnowballStemmer english_stemmer = SnowballStemmer ('english') words = ["предположительно", "предположим", ...
вопрос задан: 9 May 2014 14:57
2
ответа

Получение разных форм глаголов [дубликат]

В настоящее время я использую wordnet для получения значения слов следующим образом. от nltk.corpus import wordnet syns = wordnet.synsets («думаю») Мне интересно узнать, можно ли получить разные ...
вопрос задан: 22 September 2013 10:05
2
ответа

пользовательская маркировка с помощью nltk

Я пытаюсь создать небольшой английский язык для определения задач. Основная идея состоит в том, чтобы разбить высказывание на глаголы и существительные-фразы, к которым должны применяться эти глаголы. Я работаю с nltk, но ...
вопрос задан: 7 May 2011 05:36
2
ответа

Обнаружение времен английского глагола используя NLTK

Я ищу способ, с помощью которого можно найти глагольные фразы для английского текста в прошедшем, настоящем и будущем временах. На данный момент я использую NLTK, делаю POS (Part-Of-Speech) тегирование, а затем подсчитываю, скажем, «VBD», чтобы получить
вопрос задан: 30 March 2011 12:42
2
ответа

Анализ мнений с Python NLTK для предложений с помощью демонстрационных данных или веб-сервиса?

Я предпринимаю проект обработки естественного языка для анализа мнений. Я успешно установил NLTK для Python (походит на большую часть программного обеспечения для этого). Однако я испытываю затруднения при понимании как...
вопрос задан: 14 May 2010 13:26
2
ответа

Анализ текста с [закрытым] PHP

Я делаю проект для урока колледжа, который я посещаю. Я использую PHP для создания простого веб-приложения, которые классифицируют твиты как "положительные" (или счастливый) и "отрицательный" (или печальный) на основе ряда словарей...
вопрос задан: 7 May 2010 00:23
2
ответа

Обработка естественного языка - Идеи для [закрытых] проектов новичка

Я - новичок в обработке естественного языка и NLTK. Я очень интересуюсь обработкой естественного языка и следовательно присоединился к курсу выходных дней о AI в некотором локальном учреждении, которое требует, чтобы я сделал проект для завершения курса и
вопрос задан: 4 April 2010 14:38
2
ответа

Разница между выбором объекта, извлечением объекта, весом элемента

Я немного сбит с толку относительно того, что означают «выборка / экстрактор / весовые характеристики» и разница между ними. Когда я читаю литературу, иногда я чувствую себя потерянным, потому что нахожу термин, использованный довольно свободно, ...
вопрос задан: 30 January 2010 02:26
2
ответа

Каков фрагментатор по умолчанию для инструментария NLTK в Python?

Я использую их частеречную разметку по умолчанию и токенизацию по умолчанию.. и это кажется достаточным. Я хотел бы их фрагментатор по умолчанию также. Я читаю книгу инструментария NLTK, но не кажется, что они имеют...
вопрос задан: 6 November 2009 13:10
2
ответа

Какой стеммер слова я должен использовать в nltk?

Моя цель состоит в том, чтобы проанализировать некоторый корпус (Твиттер для теперь) для эмоционального содержания. Как раз сегодня я понял, что будет иметь немного смысла искать основы слова в противоположность наличию исчерпывающего списка...
вопрос задан: 12 August 2009 08:02
1
ответ

FreqDist с NLTK

NLTK в python имеет функцию FreqDist, которая дает вам частоту слов в тексте. Я пытаюсь передать свой текст в качестве аргумента, но результат имеет вид: ['', 'e', ​​'a', 'o', 'n', 'i', '...
вопрос задан: 25 March 2019 07:08
1
ответ

Как я могу использовать & ldquo; Interpolated Absolute Discount & rdquo; для биграмной модели в языковом моделировании?

Я хочу сравнить два метода сглаживания для биграмной модели: сглаживание с добавлением одного Интерполированное абсолютное дисконтирование Для первого метода я нашел несколько кодов. def calc_bigram_probabilty (self, ...
вопрос задан: 24 March 2019 08:29
1
ответ

элемент последовательности 0: ожидаемый экземпляр str, найден список

это часть моего code.it читает из файла Excel. Я получаю сообщение об ошибке типа "Ошибка ввода: элемент последовательности 0: ожидаемый экземпляр str, список найден". text = df.loc [page, ["rev"]] def remove_punct (text): ...
вопрос задан: 2 March 2019 11:32
1
ответ

Подсчет слов токенизированных элементов в DataFrame

У меня есть пандас DataFrame со столбцом, который включает в каждой строке список слов-токенов. Вот пример данных: импортируйте панд как pd df = pd.DataFrame ({'example': pd.Series ([...
вопрос задан: 19 January 2019 14:49
1
ответ

График лексической дисперсии NLTK не отображается в Google Colab

Приведенный ниже пример кода NLTK прекрасно работает в моей локальной системе и показывает правильную схему (https://www.nltk.org/book/ch01.html#fig-inaugural): import nltk nltk.download ('book') из nltk.book ...
вопрос задан: 19 January 2019 06:10
1
ответ

почему я не могу реализовать функцию декодирования в строку?

Я исследую набор данных и повторно запускаю код моего коллеги. При токенизации текстовых данных приведенный ниже код не работает на моем macbook, однако, хорошо работает на компьютере моего коллеги. Вот код. ...
вопрос задан: 18 January 2019 14:39
1
ответ

python - nltk присоединяется к результатам

Как присоединиться к этим результатам в текст? Я попробовал функцию ".join (), это не работает. Есть ли другие способы присоединиться к результатам из библиотеки nltk? Благодаря! Импорт nltk из nltk.stem import ...
вопрос задан: 13 July 2018 18:14
1
ответ

python nltk & mdash; список предложений / фраз

У меня есть список предложений в списке, и я хотел использовать библиотеку nltk, чтобы остановить ее. Я могу выработать одно предложение за раз, однако у меня возникают вопросы, связанные с предложениями из списка и их присоединением ...
вопрос задан: 13 July 2018 17:24
1
ответ

NLTK и обнаружение языка

Как я обнаруживаю, какой язык текст записан в использовании NLTK? Примеры я видел использование nltk.detect, но когда я установил его на своем Mac, я не могу найти этот пакет.
вопрос задан: 27 September 2017 09:30
1
ответ

поколение тега от маленького текстового содержания (такого как твиты)

Я уже задал подобный вопрос ранее, но я заметил, что имею большой, ограничьте: Я работаю над маленьким текстовым suchs наборов как пользовательские Твиты для генерации тегов (ключевые слова). И это походит...
вопрос задан: 23 May 2017 10:30
1
ответ

NLTK/pyNLTK может работать “на язык” (т.е. неанглийский язык), и как?

Как я могу сказать NLTK рассматривать текст на конкретном языке? Время от времени я пишу специализированную стандартную программу обработки естественного языка, чтобы сделать частеречную разметку, маркируя и и т.д. на неанглийском (но все еще hindo-европе
вопрос задан: 23 May 2017 10:29
1
ответ

Я должен использовать LingPipe или NLTK для извлечения имен и мест?

Я надеюсь извлекать имена, и места от очень кратковременных вспышек текстовых кардиналов "в качестве примера по сравнению с сойками в Торонто" "Daniel Nestor и Nenad Zimonjic играют Jonas Bjorkman w/Kevin Ullyett, парижское время к...
вопрос задан: 24 July 2016 08:40
1
ответ

NLTK имеет инструмент для синтаксического анализа на основе грамматики зависимостей?

Я создаю приложение обработки естественного языка и использовал Стэнфордский Синтаксический анализатор для большей части моей работы парсинга, но я хотел бы начать использовать Python. До сих пор NLTK походит на лучший выбор, но я не могу фигурировать...
вопрос задан: 23 July 2016 08:48
1
ответ

Адъективный Nominalization в Python NLTK

Существует ли способ получить прилагательное WordNet nominalizations использующий NLTK? Например, для 'счастливого' желаемый вывод был бы 'счастьем'. Я пытался вырыть вокруг, но ничего не мог найти.Спасибо!
вопрос задан: 22 July 2016 20:12
1
ответ

как перебирать вывод nltk raw_parse? [Дубликат]

Мне нужно выяснить, является ли утверждение вопросом или нет? Я следую этому вопросу. Я использую метод raw_parse для nltk StanfordParser для разбора выражения, которое я не могу перебрать по ...
вопрос задан: 29 July 2015 01:06