0
ответов

Как сделать разборы зависимости в NLTK?

Проходя через книгу NLTK, неясно, как генерировать дерево зависимости от данного предложения. Соответствующий раздел книги: суб-глава на грамматике зависимости дает пример фигуры, но он ...
вопрос задан: 25 September 2018 17:05
0
ответов

Объединение относительных выражений времени в NLP в python?

Я работаю над извлечением дат из текстов на естественном языке, и мне интересно, что может быть самым эффективным способом сделать следующее: у меня есть записи в журнале с датами в качестве заголовков, извлеченных как ...
вопрос задан: 13 July 2018 12:15
0
ответов

Чтобы найти синонимы, определения и примеры предложений с помощью WordNet

, мне нужно взять входной текстовый файл с одним словом. Затем мне нужно найти lemma_names, определение и примеры синсета слова с помощью wordnet. Я просмотрел книгу: «Python Text ...
вопрос задан: 30 May 2018 17:10
0
ответов

Не удалось загрузить english.pickle с помощью nltk. .data.load

При попытке загрузить токенизатор пунктов ... импортировать nltk.data tokenizer = nltk.data.load ('nltk: tokenizers / punkt / english.pickle') ... возникла ошибка LookupError:> LookupError:> ************** ...
вопрос задан: 29 January 2018 04:01
0
ответов

Что NLTK POS tagger просит меня загрузить?

Я только начал использовать часть речи, и у меня много проблем. Я начал тегирование POS следующим образом: import nltk text = nltk.word_tokenize («Мы уходим. Только ты и я.») Когда ...
вопрос задан: 28 November 2017 03:24
0
ответов

Как установить english.pickle для nltk на офлайн-машину с Linux

Я пытаюсь запустить nltk на компьютере SUSE Linux, который не может быть подключен к Интернету. Я успешно установил nltk, и он запускается, но когда я отправляю >>> tagged = nltk.pos _tag (tokens )я...
вопрос задан: 15 August 2017 13:20
0
ответов

RegEx Tokenizer: Text in Wörter, Ziffern, Interpunktion und Abstand aufteilen (nichts löschen)

Ich habe die Antwort auf diese Frage in diesem Thread fast gefunden (Antwort von samplebias); Ich muss jedoch eine Phrase in Wörter, Ziffern, Satzzeichen und Leerzeichen / Tabulatoren aufteilen. Ich brauche dies auch, um zu bewahren ...
вопрос задан: 23 May 2017 12:33
0
ответов

извлечение отношений с помощью NLTK

Это продолжение моего вопроса. Я использую nltk для извлечения лиц, организаций и их связей. Используя этот пример, я смог создать фрагменты лиц и организаций; однако, ...
вопрос задан: 23 May 2017 12:17
0
ответов

Производительность NLTK

Хорошо, в последнее время я очень интересовался обработкой естественного языка: однако до сих пор я использовал C для большей части моя работа. Я слышал о NLTK и не знал Python, но мне кажется, что это довольно легко ...
вопрос задан: 23 May 2017 12:02
0
ответов

Эффективное извлечение 1-5 грамм с питоном

У меня есть огромные файлы по 3 000 000 строк, и каждая строка содержит 20-40 слов. Я должен извлечь от 1 до 5 нграмм из корпуса. Мои входные файлы представляют собой простой текстовый токен, например: это предложение в строке foo. ...
вопрос задан: 23 May 2017 12:01
0
ответов

Выбор наиболее свободного текста из набора возможностей с помощью проверки грамматики (Python)

Некоторое прошлое Я учусь на литературу в Нью-колледже Флориды, в настоящее время работаю над чрезмерно амбициозным творческим проектом. Проект ориентирован на алгоритмическое поколение поэзии. Это'...
вопрос задан: 23 May 2017 11:58
0
ответов

Instantiating and using StanfordTagger within NLTK

Прошу прощения за новичковую природу этого вопроса - я пытался разобраться в упаковке Python и пространствах имен, но тонкости, похоже, ускользают от меня. К примеру, я хотел бы использовать Python ...
вопрос задан: 23 May 2017 11:53
0
ответов

Wat sinn e puer gutt Weeër fir "ongeféier" semantesch Ähnlechkeet tëscht Sätz ze schätzen?

Ech hunn den nlp Tag op SO fir déi lescht Stonne gekuckt an sinn zouversiichtlech datt ech näischt verpasst hunn awer wann ech gelift, weist mir weg op d'Fro. An der Tëschenzäit awer, wäert ech ...
вопрос задан: 23 May 2017 11:46
0
ответов

Какой набор спама я могу использовать в NLTK?

Мой вопрос в значительной степени связан с этим, но я решил открыть другую ветку вопросов. Надеюсь, все в порядке. Я также создаю фильтр спама, используя NLTK в Python, но я только начал. Я ...
вопрос задан: 23 May 2017 10:29
0
ответов

Обнаружение «шаблонов» в данном тексте?

Если у меня есть значительный объем текста и я пытаюсь обнаружить наиболее часто встречающиеся шаблоны, я думал решить эту проблему с помощью N- Подход по Грамму, и на самом деле он был предложен в качестве решения ...
вопрос задан: 23 May 2017 10:27
0
ответов

Какие инструменты НЛП использовать для сопоставления фраз, имеющих сходное значение или семантику

Я работаю над проектом, который требует от меня сопоставления фразы или ключевого слова с набором похожих ключевых слов. Мне нужно выполнить семантический анализ для того же самого. пример :Соответствующий QT дешевое здоровье...
вопрос задан: 29 April 2017 16:09
0
ответов

Извлечение слов с помощью nltk из немецкого текста

Я пытаюсь извлечь слова из немецкого документа, когда я использую следующий метод, описанный в учебнике nltk, мне не удается получить слова со специальными символами, специфичными для языка. ptcr = nltk....
вопрос задан: 13 February 2017 02:33
0
ответов

Как получить набор синхронизации WordNet с заданным идентификатором смещения?

У меня есть смещение набора синхронизации WordNet (например, id = "n # 05576222"). Учитывая это смещение, как я могу получить набор синхронизации с помощью Python?
вопрос задан: 9 February 2017 14:08
0
ответов

Как настроить данные nltk каталог из кода?

Как настроить каталог данных nltk из кода?
вопрос задан: 2 September 2016 04:16
0
ответов

Преимущества создания собственного корпуса в NLTK

У меня большой объем текста в таблицах Mysql. Я хочу провести некоторый статистический анализ, а затем немного NLP в моем тексте, используя инструментарий NLTK. У меня есть два варианта: Извлечь весь текст сразу из моих ...
вопрос задан: 22 January 2016 19:10
0
ответов

Извлечение всех существительных из текстового файла с помощью nltk

Есть ли более эффективный способ сделать это? Мой код читает текстовый файл и извлекает все существительные. import nltk File = open (fileName) # открыть строки файла = File.read () # прочитать все строки предложения = nltk ....
вопрос задан: 7 November 2015 21:10
0
ответов

Как проверить, является ли слово английским словом с помощью Python?

Я хочу проверить в программе Python, есть ли слово в словаре английского языка. Я считаю, что интерфейс nltk wordnet может быть подходящим вариантом, но я понятия не имею, как его использовать для такой простой задачи. def ...
вопрос задан: 20 September 2015 22:13
0
ответов

Генерация Nграмм (Unigrams, Bigrams и т. Д.) Из большого массива файлов .txt и их частоты

Мне нужно написать программу на NLTK, которая разбивает корпус (большой набор текстовых файлов) на униграммы, биграммы, триграммы, четырехграммы и пятьграмм. Я уже написал код для ввода своих файлов в ...
вопрос задан: 7 September 2015 15:04
0
ответов

Распознавание именованных сущностей NLTK в списке Python

Я использовал ne_chunk NLTK для извлечения именованных сущностей из текста: my_sent = "ВАШИНГТОН - После ряда злоупотреблений со стороны нью-йоркских полицейских в 1990-х годах, Лоретта Э. Линч, высшая федеральная власть ...
вопрос задан: 5 August 2015 14:58
0
ответов

Использование NLTK и WordNet ; как преобразовать глагол простого времени в настоящее, Форма причастия прошедшего или прошедшего времени?

Как с помощью NLTK и WordNet преобразовать глагол простого времени в формы причастия настоящего, прошедшего или прошедшего времени? Например: я хочу написать функцию, которая дала бы мне глагол в ожидаемой форме как ...
вопрос задан: 12 April 2015 15:20
0
ответов

Обработка общих синонимов и частей речи с использованием nltk

Я пытаюсь создать общий идентификатор синонимов для слов в предложении, которые являются значимыми (т.е. не «a» или «the»), и я использую набор инструментов для естественного языка (nltk) в python для него. The ...
вопрос задан: 22 February 2015 21:51
0
ответов

Проекты машинного обучения с открытым исходным кодом, ориентированные на веб / браузер?

Применение методов машинного обучения, в частности методов интеллектуального анализа текста, в среде браузера (в основном Javascript) или в качестве веб-приложения не является очень широко обсуждаемой темой. Я хочу ...
вопрос задан: 1 December 2014 19:29
0
ответов

Python nltk: Find collocations without dot-separated words

Я пытаюсь найти коллокации с помощью NLTK в тексте, используя встроенный метод. Сейчас у меня есть следующий пример текста (test и foo следуют друг за другом, но есть граница предложения в ...
вопрос задан: 15 November 2014 08:11
0
ответов

Разбор HTML на предложения -Как работать с таблицами/списками/заголовками и т. д.?

Как вы разбираете HTML-страницу со свободным текстом, списками, таблицами, заголовками и т. д. на предложения? Возьмем, к примеру, эту страницу в Википедии. Есть/есть :свободный текст:http://en.wikipedia.org/wiki/...
вопрос задан: 8 September 2014 04:07
0
ответов

Использование целых чисел / дат в качестве терминалов в парсере NLTK

Я пытаюсь использовать парсер Эрли в NLTK для анализа такие предложения, как: Если дата до 21.12.2010, то serial = 10 Для этого я пытаюсь написать CFG, но проблема в том, что мне понадобится ...
вопрос задан: 17 August 2014 23:30