Джеймс может хорошо и хорошо петь (TOP (S (NP (Джеймс NNP)) (VP (MD может) (VP (петь VB)) (ADVP (хорошо RB) (CC и) (хорошо RB)))))) Здесь я хочу получить "ADVP", что "хорошо и хорошо". Я могу получить NP VP по ...
Я извлекаю собственные существительные из столбца, содержащего строковые данные. Я хочу переместить извлеченные существительные в новый столбец в виде списка (или, в качестве альтернативы, как одно существительное на дополнительный столбец). Есть ...
Пока у меня есть этот код ниже из textblob import TextBlob class BrinBot: def __init __ (self, message): # Принимает сообщение от пользователя в качестве аргумента parse (message) class parse: ...
Вот код, который я написал для пометки: sn = StanfordNERTagger ("/ home / ikscare / Documents / Projects / Mousam / stanford-ner-2014-08-27 / classifiers / english.all.3class.distsim.crf.ser .gz ", ...
Я с нетерпением жду реализации чего-то вроде прямых ответов Google, которые используют график знаний, есть ли какой-нибудь полезный ресурс, который я могу прочитать? также Где я могу найти данные для этого? Заранее спасибо
На самом деле работа над проектом - это обнаружение экономического события из французского корпуса. У меня есть более 10000 корпусов, которые я собирал в газете, и каждый корпус говорит о компании. для каждого ...
Корпус Word Net NLTK, вероятно, не обеспечивает функциональность тропонима. Есть ли другой способ получить тропонимы глагола, не загружая всю базу данных. Как API или какая-то другая библиотека для ...
Я пытаюсь обучить 3 (выпуск, нарр, событие) различных текстовых данных, сначала разбивая их на токены, а затем передавая их на свой слой внедрения. Я получаю следующую ошибку: ValueError: При подаче символов ...
Я работаю над постановкой задачи классификации документов. Для решения у меня уже есть список, содержащий некоторые конкретные ключевые слова из каждого класса, и мне нужно предсказать класс документа на его основе. ...
Я пытаюсь определить, к какой функциональной области относится название роли, основываясь на наборе ключевых слов, определенных для каждой функции. У меня есть список ролей (пример - не исчерпывающий) > роли [1] "...
У меня есть датафрейм панды, который состоит из баллов студентов. Я хочу создать облако слов или облако чисел для оценок. Есть ли способ добиться этого. Я перепробовал все возможные способы, но ...
Я использую Python. На высоком уровне у меня есть набор документов, связанных с исходным ключевым словом, и я хочу ранжировать документы в порядке соответствия этому исходному ключевому слову (я привел пример ...
Я разрабатываю систему для проведения онлайн-экзаменов, которые оценивают ответы учеников по сравнению со справочным ответом учителя. В настоящее время у меня сопоставление с образцом в Python сравнивает два текста ...
torchtext может читать файл с несколькими столбцами, каждый из которых соответствует полю. Что делать, если я хочу создать новый столбец (который я буду использовать в качестве функции)? Например, представьте, что файл имеет два ...
Кто-нибудь знает, что означают числа после объективности, предоставляемой набором настроений? Некоторые слова, которые возвращаются, являются глаголами, но имеют различные числа, такие как v.01 или v.03, как показано в ...
Я использую treetagger в R через библиотеку koRpus. Я скачал тег дерева с http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/, а также английские параметры из того же места и ...
Было бы неплохо, если есть способ воспроизвести результат тренировки в spaCy. Ниже фрагмент обучает тривиальный компонент NER, но показывает разные результаты в отдельных прогонах. Это ожидаемое поведение? ...
Я работаю с spacy, чтобы проанализировать текст на французском языке. Каким-то образом, по моим данным, все акцентированные символы были заменены их неакцентированными эквивалентами (например: réserve -> Reserve). Следовательно, когда я пытаюсь ...
Я пытаюсь использовать инструмент анализа настроений для анализа данных. Я сталкивался с несколькими крайними случаями, когда общее настроение предложения может быть положительным, но содержать отрицательное слово. Например : ...
Я использую пакет «SentimentAnalysis» для анализа PDF-файла, но его ближайшие страницы за страницей, а не в целом. я читаю pdf файлы, используя пакет "pdftools", ниже приведен код: тогда я использую "...
Я тренирую классификатор текста, используя TextCNN, в результате, точность низкая (0,6), в то время как отзыв высокий (0,9), как более глубокое изучение, я не могу найти методы оптимизации для повышения .. ,
Я пытался прочитать файл .docx и скопировать его текст в файл .txt, который я начал с написания этого фрагмента сценария для достижения вышеуказанных результатов. if extension == 'docx': document = ...
Я использовал следующий набор данных классификации предложений (https://archive.ics.uci.edu/ml/datasets/Sentence+Classification). Я извлек словарный запас и создал модель word2Vec, которую я сохранил. Я пытаюсь ...
У меня есть следующий список словарей, которые должны быть в этом формате: инцидент ключевые слова = [{'INC000007581874': 'ccd browser'}, {'INC000007581947': 'CATIA'}, ...
Я пытаюсь создать файл ONNX для примера run_classifier.py pytorch-pretrained-bert. В этом случае я запускаю его со следующими параметрами согласно основному README.md: export GLUE_DIR = ...
В ответ на вопрос, который я разместил здесь, я хотел бы спросить, возможно ли исключить определенные теги уровня фразы при разборе. В частности, я использую Stanford CorenNLP версии 3.9.2 Shift -...
Я пытаюсь сделать регулярное выражение, которое может токенизировать данное предложение, используя re.compile (regex) .findall (text). Основная проблема - заставить его работать с любыми символами Юникода, а не только с \ w. Итак, у меня есть два ...
Я пересматриваю отзывы для компаний. Я преуспел в очистке обзора, но единственная 1-ая страница обзора извлечена. Ранее я использовал Scrapy.crawl. Я изменил его на Spider, но все же ...
Я использую FeatureUnion для объединения функций, найденных в заголовке и описании событий: union = FeatureUnion (transformer_list = [# Конвейер для извлечения объектов из заголовка события ...
Я большой поклонник находить предложения, которые можно очень быстро читать. Например, «надо немного почитать Википедию» или «не хочу оказаться в канаве с бутылкой солода». (Джордж ...