0
ответов

Как определить подраздел NP, VP, используя NLP в Java

Джеймс может хорошо и хорошо петь (TOP (S (NP (Джеймс NNP)) (VP (MD может) (VP (петь VB)) (ADVP (хорошо RB) (CC и) (хорошо RB)))))) Здесь я хочу получить "ADVP", что "хорошо и хорошо". Я могу получить NP VP по ...
вопрос задан: 29 March 2019 03:04
0
ответов

Перемещение строковых данных в новые столбцы, где число значений является произвольным

Я извлекаю собственные существительные из столбца, содержащего строковые данные. Я хочу переместить извлеченные существительные в новый столбец в виде списка (или, в качестве альтернативы, как одно существительное на дополнительный столбец). Есть ...
вопрос задан: 28 March 2019 23:10
0
ответов

Точность тегов TextBlob и NLTK POS

Пока у меня есть этот код ниже из textblob import TextBlob class BrinBot: def __init __ (self, message): # Принимает сообщение от пользователя в качестве аргумента parse (message) class parse: ...
вопрос задан: 24 March 2019 18:19
0
ответов

Огромный недостаток движка Stanford NER заключается в том, что он не объединяет названия одной сущности. Какой может быть подход к этому

Вот код, который я написал для пометки: sn = StanfordNERTagger ("/ home / ikscare / Documents / Projects / Mousam / stanford-ner-2014-08-27 / classifiers / english.all.3class.distsim.crf.ser .gz ", ...
вопрос задан: 22 March 2019 14:20
0
ответов

Как реализовать график знаний

Я с нетерпением жду реализации чего-то вроде прямых ответов Google, которые используют график знаний, есть ли какой-нибудь полезный ресурс, который я могу прочитать? также Где я могу найти данные для этого? Заранее спасибо
вопрос задан: 21 March 2019 22:38
0
ответов

Обнаружение экономического события на французском корпусе

На самом деле работа над проектом - это обнаружение экономического события из французского корпуса. У меня есть более 10000 корпусов, которые я собирал в газете, и каждый корпус говорит о компании. для каждого ...
вопрос задан: 18 March 2019 16:31
0
ответов

Как получить тропонимы из Word Net?

Корпус Word Net NLTK, вероятно, не обеспечивает функциональность тропонима. Есть ли другой способ получить тропонимы глагола, не загружая всю базу данных. Как API или какая-то другая библиотека для ...
вопрос задан: 18 March 2019 11:47
0
ответов

ValueError: при подаче символьных тензоров в модель мы ожидаем, что у тензоров будет статический размер пакета. Получил тензор с формой: (Нет, 10)

Я пытаюсь обучить 3 (выпуск, нарр, событие) различных текстовых данных, сначала разбивая их на токены, а затем передавая их на свой слой внедрения. Я получаю следующую ошибку: ValueError: При подаче символов ...
вопрос задан: 13 March 2019 22:17
0
ответов

Разработка классификатора для классификации документов на основе соответствия конкретных ключевых слов

Я работаю над постановкой задачи классификации документов. Для решения у меня уже есть список, содержащий некоторые конкретные ключевые слова из каждого класса, и мне нужно предсказать класс документа на его основе. ...
вопрос задан: 11 March 2019 15:01
0
ответов

Соответствие текстовых строк с набором ключевых слов / категорий (R)

Я пытаюсь определить, к какой функциональной области относится название роли, основываясь на наборе ключевых слов, определенных для каждой функции. У меня есть список ролей (пример - не исчерпывающий) > роли [1] "...
вопрос задан: 8 March 2019 04:28
0
ответов

Создайте облако слов, чтобы показать частоты чисел в Python

У меня есть датафрейм панды, который состоит из баллов студентов. Я хочу создать облако слов или облако чисел для оценок. Есть ли способ добиться этого. Я перепробовал все возможные способы, но ...
вопрос задан: 7 March 2019 21:14
0
ответов

Оценка того, насколько близко слово относится к ключевым словам в документе с использованием tf-idf и машинного обучения

Я использую Python. На высоком уровне у меня есть набор документов, связанных с исходным ключевым словом, и я хочу ранжировать документы в порядке соответствия этому исходному ключевому слову (я привел пример ...
вопрос задан: 5 March 2019 17:18
0
ответов

уместна ли функция сопоставления с образцом в python для системы оценки ответов?

Я разрабатываю систему для проведения онлайн-экзаменов, которые оценивают ответы учеников по сравнению со справочным ответом учителя. В настоящее время у меня сопоставление с образцом в Python сравнивает два текста ...
вопрос задан: 1 March 2019 20:56
0
ответов

Как я могу добавить функцию, используя torchtext?

torchtext может читать файл с несколькими столбцами, каждый из которых соответствует полю. Что делать, если я хочу создать новый столбец (который я буду использовать в качестве функции)? Например, представьте, что файл имеет два ...
вопрос задан: 19 January 2019 14:07
0
ответов

Нумерация в Sentiwordnet

Кто-нибудь знает, что означают числа после объективности, предоставляемой набором настроений? Некоторые слова, которые возвращаются, являются глаголами, но имеют различные числа, такие как v.01 или v.03, как показано в ...
вопрос задан: 19 January 2019 04:31
0
ответов

Treetagger: не могу найти файл лексикона после установки

Я использую treetagger в R через библиотеку koRpus. Я скачал тег дерева с http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/, а также английские параметры из того же места и ...
вопрос задан: 18 January 2019 19:36
0
ответов

Воспроизвести результаты обучения spaCy

Было бы неплохо, если есть способ воспроизвести результат тренировки в spaCy. Ниже фрагмент обучает тривиальный компонент NER, но показывает разные результаты в отдельных прогонах. Это ожидаемое поведение? ...
вопрос задан: 18 January 2019 17:46
0
ответов

Spacy - интерпретировать текст с полосатыми акцентами

Я работаю с spacy, чтобы проанализировать текст на французском языке. Каким-то образом, по моим данным, все акцентированные символы были заменены их неакцентированными эквивалентами (например: réserve -> Reserve). Следовательно, когда я пытаюсь ...
вопрос задан: 18 January 2019 14:33
0
ответов

Анализ настроений для предложений с общим положительным настроением, но с отрицательными словами

Я пытаюсь использовать инструмент анализа настроений для анализа данных. Я сталкивался с несколькими крайними случаями, когда общее настроение предложения может быть положительным, но содержать отрицательное слово. Например : ...
вопрос задан: 18 January 2019 10:24
0
ответов

Анализ настроений PDF-файлов в R

Я использую пакет «SentimentAnalysis» для анализа PDF-файла, но его ближайшие страницы за страницей, а не в целом. я читаю pdf файлы, используя пакет "pdftools", ниже приведен код: тогда я использую "...
вопрос задан: 17 January 2019 13:51
0
ответов

Как оптимизировать модель в задаче классификации текста?

Я тренирую классификатор текста, используя TextCNN, в результате, точность низкая (0,6), в то время как отзыв высокий (0,9), как более глубокое изучение, я не могу найти методы оптимизации для повышения .. ,
вопрос задан: 17 January 2019 10:55
0
ответов

Как извлечь текст из файла DOCX и сохранить в текстовом файле

Я пытался прочитать файл .docx и скопировать его текст в файл .txt, который я начал с написания этого фрагмента сценария для достижения вышеуказанных результатов. if extension == 'docx': document = ...
вопрос задан: 17 January 2019 09:45
0
ответов

Машинное обучение word2vec встраивание текстовой классификации keras

Я использовал следующий набор данных классификации предложений (https://archive.ics.uci.edu/ml/datasets/Sentence+Classification). Я извлек словарный запас и создал модель word2Vec, которую я сохранил. Я пытаюсь ...
вопрос задан: 16 January 2019 21:25
0
ответов

Как бы я перебрал список словарей и применил еще один цикл для каждого элемента в списке?

У меня есть следующий список словарей, которые должны быть в этом формате: инцидент ключевые слова = [{'INC000007581874': 'ccd browser'}, {'INC000007581947': 'CATIA'}, ...
вопрос задан: 16 January 2019 21:05
0
ответов

Как вы генерируете представление ONNX нейронной сети, прошедшей предварительную подготовку?

Я пытаюсь создать файл ONNX для примера run_classifier.py pytorch-pretrained-bert. В этом случае я запускаю его со следующими параметрами согласно основному README.md: export GLUE_DIR = ...
вопрос задан: 16 January 2019 15:12
0
ответов

Ограничение набора тегов на уровне фраз Stanford CoreNLP

В ответ на вопрос, который я разместил здесь, я хотел бы спросить, возможно ли исключить определенные теги уровня фразы при разборе. В частности, я использую Stanford CorenNLP версии 3.9.2 Shift -...
вопрос задан: 15 January 2019 21:27
0
ответов

Как сделать окончательную альтернативную группу в регулярном выражении Python-flavour?

Я пытаюсь сделать регулярное выражение, которое может токенизировать данное предложение, используя re.compile (regex) .findall (text). Основная проблема - заставить его работать с любыми символами Юникода, а не только с \ w. Итак, у меня есть два ...
вопрос задан: 15 January 2019 17:20
0
ответов

Я не могу сканировать несколько страниц, чтобы получить отзывы .. Я получаю только первую страницу отзывов

Я пересматриваю отзывы для компаний. Я преуспел в очистке обзора, но единственная 1-ая страница обзора извлечена. Ранее я использовал Scrapy.crawl. Я изменил его на Spider, но все же ...
вопрос задан: 30 December 2018 09:44
0
ответов

Получение имен объектов из FeatureUnion + Pipeline

Я использую FeatureUnion для объединения функций, найденных в заголовке и описании событий: union = FeatureUnion (transformer_list = [# Конвейер для извлечения объектов из заголовка события ...
вопрос задан: 8 November 2018 02:10
0
ответов

Найдите слова и комбинации слов, которые можно произнести быстрее всего

Я большой поклонник находить предложения, которые можно очень быстро читать. Например, «надо немного почитать Википедию» или «не хочу оказаться в канаве с бутылкой солода». (Джордж ...
вопрос задан: 16 October 2018 14:50