Я пытаюсь использовать TF-IDF для сортировки документов в категории. Я вычислил tf_idf для некоторых документов, но теперь когда я пытаюсь вычислить Подобие Косинуса между двумя из этих документов, я добираюсь...
Почему нам нужно обучать PunktSentenceTokenizer? Как он проходит обучение в бэкэнд? Какова логика обучения и как она отличается от базового Tokeniser в NLTK
Я использую NLTK для извлечения существительных из текстовой строки, запускающейся со следующей команды: tagged_text = nltk.pos_tag (nltk. Текст (nltk.word_tokenize (some_string))), Это хорошо работает на английском языке. Есть ли...
Я играю вокруг с Инструментарием естественного языка (NLTK). Его документация (Книга и ПРАКТИЧЕСКОЕ РУКОВОДСТВО) является довольно большой, и примеры иногда немного совершенствуются. Там хорошо работают, но являются основными...
В настоящее время я занимаюсь регулярными выражениями и NLTK (Natural Language Toolkit). Я хочу выражать предложения в словах и пунктуации. Схватки вроде «не могу», «я сделаю» и т. Д. ...
Следующий код должен выводить слова стека, но вместо этого я получаю объект-генератор. из nltk.stem import SnowballStemmer english_stemmer = SnowballStemmer ('english') words = ["предположительно", "предположим", ...
В настоящее время я использую wordnet для получения значения слов следующим образом. от nltk.corpus import wordnet syns = wordnet.synsets («думаю») Мне интересно узнать, можно ли получить разные ...
Я пытаюсь создать небольшой английский язык для определения задач. Основная идея состоит в том, чтобы разбить высказывание на глаголы и существительные-фразы, к которым должны применяться эти глаголы. Я работаю с nltk, но ...
Я ищу способ, с помощью которого можно найти глагольные фразы для английского текста в прошедшем, настоящем и будущем временах. На данный момент я использую NLTK, делаю POS (Part-Of-Speech) тегирование, а затем подсчитываю, скажем, «VBD», чтобы получить
Я предпринимаю проект обработки естественного языка для анализа мнений. Я успешно установил NLTK для Python (походит на большую часть программного обеспечения для этого). Однако я испытываю затруднения при понимании как...
Я делаю проект для урока колледжа, который я посещаю. Я использую PHP для создания простого веб-приложения, которые классифицируют твиты как "положительные" (или счастливый) и "отрицательный" (или печальный) на основе ряда словарей...
Я - новичок в обработке естественного языка и NLTK. Я очень интересуюсь обработкой естественного языка и следовательно присоединился к курсу выходных дней о AI в некотором локальном учреждении, которое требует, чтобы я сделал проект для завершения курса и
Я немного сбит с толку относительно того, что означают «выборка / экстрактор / весовые характеристики» и разница между ними. Когда я читаю литературу, иногда я чувствую себя потерянным, потому что нахожу термин, использованный довольно свободно, ...
Я использую их частеречную разметку по умолчанию и токенизацию по умолчанию.. и это кажется достаточным. Я хотел бы их фрагментатор по умолчанию также. Я читаю книгу инструментария NLTK, но не кажется, что они имеют...
Моя цель состоит в том, чтобы проанализировать некоторый корпус (Твиттер для теперь) для эмоционального содержания. Как раз сегодня я понял, что будет иметь немного смысла искать основы слова в противоположность наличию исчерпывающего списка...
NLTK в python имеет функцию FreqDist, которая дает вам частоту слов в тексте. Я пытаюсь передать свой текст в качестве аргумента, но результат имеет вид: ['', 'e', 'a', 'o', 'n', 'i', '...
Я хочу сравнить два метода сглаживания для биграмной модели: сглаживание с добавлением одного Интерполированное абсолютное дисконтирование Для первого метода я нашел несколько кодов. def calc_bigram_probabilty (self, ...
это часть моего code.it читает из файла Excel. Я получаю сообщение об ошибке типа "Ошибка ввода: элемент последовательности 0: ожидаемый экземпляр str, список найден". text = df.loc [page, ["rev"]] def remove_punct (text): ...
У меня есть пандас DataFrame со столбцом, который включает в каждой строке список слов-токенов. Вот пример данных: импортируйте панд как pd df = pd.DataFrame ({'example': pd.Series ([...
Приведенный ниже пример кода NLTK прекрасно работает в моей локальной системе и показывает правильную схему (https://www.nltk.org/book/ch01.html#fig-inaugural): import nltk nltk.download ('book') из nltk.book ...
Я исследую набор данных и повторно запускаю код моего коллеги. При токенизации текстовых данных приведенный ниже код не работает на моем macbook, однако, хорошо работает на компьютере моего коллеги. Вот код. ...
Как присоединиться к этим результатам в текст? Я попробовал функцию ".join (), это не работает. Есть ли другие способы присоединиться к результатам из библиотеки nltk? Благодаря! Импорт nltk из nltk.stem import ...
У меня есть список предложений в списке, и я хотел использовать библиотеку nltk, чтобы остановить ее. Я могу выработать одно предложение за раз, однако у меня возникают вопросы, связанные с предложениями из списка и их присоединением ...
Как я обнаруживаю, какой язык текст записан в использовании NLTK? Примеры я видел использование nltk.detect, но когда я установил его на своем Mac, я не могу найти этот пакет.
Я уже задал подобный вопрос ранее, но я заметил, что имею большой, ограничьте: Я работаю над маленьким текстовым suchs наборов как пользовательские Твиты для генерации тегов (ключевые слова). И это походит...
Как я могу сказать NLTK рассматривать текст на конкретном языке? Время от времени я пишу специализированную стандартную программу обработки естественного языка, чтобы сделать частеречную разметку, маркируя и и т.д. на неанглийском (но все еще hindo-европе
Я надеюсь извлекать имена, и места от очень кратковременных вспышек текстовых кардиналов "в качестве примера по сравнению с сойками в Торонто" "Daniel Nestor и Nenad Zimonjic играют Jonas Bjorkman w/Kevin Ullyett, парижское время к...
Я создаю приложение обработки естественного языка и использовал Стэнфордский Синтаксический анализатор для большей части моей работы парсинга, но я хотел бы начать использовать Python. До сих пор NLTK походит на лучший выбор, но я не могу фигурировать...
Существует ли способ получить прилагательное WordNet nominalizations использующий NLTK? Например, для 'счастливого' желаемый вывод был бы 'счастьем'. Я пытался вырыть вокруг, но ничего не мог найти.Спасибо!
Мне нужно выяснить, является ли утверждение вопросом или нет? Я следую этому вопросу. Я использую метод raw_parse для nltk StanfordParser для разбора выражения, которое я не могу перебрать по ...