3
ответа

Инструменты синтаксического анализа естественных языков: что там и что не? [закрытый]

Я ищу различные инструменты обработки естественного языка для проекта, я продолжаю работать, и прямо сейчас я нашел самыми полезными проекты обработки естественного языка Стэнфорда. Делает любой знает, существуют ли другие инструменты, которые являются та
вопрос задан: 14 January 2010 19:40
3
ответа

Как выбрать Feature Selection Algorithm? - совет

Есть ли научно-исследовательская работа / книга, которую я могу прочитать, который может сказать мне для проблемы под рукой, какой алгоритм выбора функции работал бы лучше всего. Я пытаюсь просто определить сообщения Твиттера как...
вопрос задан: 14 January 2010 16:51
3
ответа

Соответствие подстрокам от словаря до другой строки: предложения?

Привет люди Переполнения стека. Я хотел бы некоторые предложения относительно следующей проблемы. Я использую Java. У меня есть массив № 1 со многими Строками. Например, две из строк могли бы быть: "...
вопрос задан: 6 January 2010 15:30
3
ответа

Что предпосылки к изучению обработки естественного языка? [закрытый]

Я планирую изучить обработку естественного языка в этом году. Но когда я начинаю читать вводные книги по этой теме, я нашел, что упускаю много сути, имеющей отношение главным образом к математике. Таким образом, я...
вопрос задан: 5 January 2010 14:58
3
ответа

Как распознать слова в тексте с несловоупотреблениями?

Я в настоящее время анализирую набор писем и хочу вытащить слова и другие интересные маркеры из писем (даже с орфографическими ошибками или комбинацией символов и букв, как "zebra21" или "...
вопрос задан: 4 January 2010 17:36
3
ответа

Обнаружить имена собственные с WordNet?

Я использую JAWS для доступа к WordNet. Учитывая слово, там какой-либо способ обнаружить, если это - имя собственное? Похоже, что synsets имеют довольно крупные лексические категории. Для разъяснения нет никакого контекста для...
вопрос задан: 2 January 2010 18:31
3
ответа

каково истинное различие между лемматизацией по сравнению со стеммингом?

Когда я использую каждого? Также... действительно ли лемматизация NLTK зависит от Частей речи? Разве не было бы более правильно, если бы это было?
вопрос задан: 24 November 2009 00:48
3
ответа

Бинаризация в обработке естественного языка

Бинаризация является действием преобразования красочных функций объекта в векторы чисел, чаще всего двоичные векторы, для создания хороших примеров для алгоритмов классификатора. Если мы, где к binarize...
вопрос задан: 18 November 2009 06:58
3
ответа

Командный язык естественного языка

Я интересуюсь разработкой командного языка естественного языка для домена с существующими правилами. Я был очень впечатлен, когда SHRDLU Terry Winograd показал путь (разговор ниже составляет 40 лет...
вопрос задан: 24 October 2009 19:35
3
ответа

Существует ли синтаксический анализатор естественных языков для дат/времен в ColdFusion?

Существует ли синтаксический анализатор естественных языков для даты/времен в ColdFusion?
вопрос задан: 4 October 2009 21:03
3
ответа

Использование NLTK Python (2.0b5) на Google App Engine

Я пытался сделать NLTK (Инструментарий естественного языка) работой над Google App Engine. Шаги, которые я выполнил: Загрузите установщик и выполните его (.dmg файл, поскольку я использую Mac). скопируйте...
вопрос задан: 17 August 2009 12:06
3
ответа

Идентификация географических положений в тексте

Какая работа была сделана, чтобы определить, принадлежит ли определенная строка географическому положению? Например: 'Троя, ny' 'Остин, 'отели Техаса в Лас-Вегасе, nv' я предполагаю то, что я - вид...
вопрос задан: 29 July 2009 15:08
3
ответа

Наивное байесово вычисление в sql

Я хочу использовать наивный байесов для классификации документов в относительно большое количество классов. Я надеюсь подтверждать, является ли упоминание об имени объекта в статье действительно то, что объект на основе...
вопрос задан: 13 April 2009 21:24
3
ответа

Создание или Нахождение “соответствующие условия” функция предложения

Учитывая несколько слов входа, я хочу иметь утилиту, которая возвратит разнообразный набор соответствующих условий, фраз или понятий. Протест состоит в том, что это должно было бы иметь большой график условий для начала...
вопрос задан: 4 March 2009 14:33
3
ответа

Инструмент конечного пользователя для генерации регулярного выражения

У нас есть требование к приложению SaaS, чтобы позволить пользователю, ответственному за создание сайта CMS определять до 10 пользовательских полей в форме. Как часть этого определения поля мы хотим добавить поле...
вопрос задан: 4 December 2008 17:35
3
ответа

Скрытое распределение Дирихле, ловушки, подсказки и программы

Я экспериментирую со Скрытым распределением Дирихле для разрешения неоднозначности темы и присвоения, и я ищу совет. Какая программа является "лучшей", где лучше всего некоторая комбинация самых легких для использования...
вопрос задан: 10 October 2008 21:10
2
ответа

Как исправить NameError: имя 'phrasedocs' не определено

Я работаю над задачей классификации, используя набор обзоров фильмов из Kaggle. Часть, с которой я борюсь, представляет собой серию функций, в которых выход одного становится входом следующего. ...
вопрос задан: 31 March 2019 00:34
2
ответа

Предсказание пропущенных слов в предложении - модель обработки естественного языка [закрыто]

У меня есть предложение ниже: я хочу ____ автомобиль, потому что это дешево. Я хочу предсказать пропущенное слово, используя модель НЛП. Какую модель НЛП я должен использовать? Благодарю.
вопрос задан: 4 March 2019 07:27
2
ответа

Назначить идентификатор на основе ключевых слов в твитах

Я извлек твиты, введя 44 различных ключевых слова, и результат находится в файле, который состоит из 400 тысяч твитов. Выходной файл содержит твиты, которые содержат соответствующие ключевые слова. Как ...
вопрос задан: 18 January 2019 15:39
2
ответа

Как исправить проблему «кодирования» в Python с помощью пакета vaderSentiment

Я работаю над проблемой анализа настроений и обнаружил пакет vaderSentiment, но не могу запустить его. Это дает мне ошибку «кодирования». Я попытался добавить «из IO Импорт Open», но это ...
вопрос задан: 17 January 2019 14:48
2
ответа

Удалить список стоп-слов из списка в Python (обработка естественного языка)

Я пытался удалить стоп-слова, используя код Python 3, но мой код, кажется, не работает, я хочу знать, как удалить стоп-слова из списка ниже. Пример структуры выглядит следующим образом: from ...
вопрос задан: 17 January 2019 10:47
2
ответа

«bert-serve-start» не распознается как внутренняя или внешняя команда

это очень глупый вопрос ..... Я следую документации документации bert-as-service, чтобы установить его. У меня есть Python 3.6.6, тензор потока 1.12.0, все делает в среде conda, Windows 10. Я пип ...
вопрос задан: 16 January 2019 15:40
2
ответа

В Обработке естественного языка, какова цель разделить на блоки?

В Обработке естественного языка, какова цель разделить на блоки?
вопрос задан: 18 January 2018 16:15
2
ответа

Что такое хорошая библиотека фильтров ненормативной лексики Python? [закрыто]

Как https://stackoverflow.com/questions/1521646/best-profanity-filter, но для Python - и я ищу библиотеки, которые я могу запускать и контролировать самостоятельно на месте, в отличие от веб-сервисов. (И пока это '...
вопрос задан: 23 May 2017 12:26
2
ответа

Как алгоритм актуальных тем Твиттера решает который слова извлечь из твитов?

Я видел этот вопрос, который фокусируется на проблеме "Brittney Spears". Но у меня есть определенный другой вопрос. Как алгоритм определяет, какие слова или фразы должны быть оценены? Для...
вопрос задан: 23 May 2017 12:24
2
ответа

Как я могу приблизительно определить «Вы имели в виду?» без использования Google?

Мне известны дубликаты этого вопроса: Как Google "Вы имели в виду?" Алгоритм работает? Как реализовать «Вы имели в виду»? ... и многие другие. Эти вопросы интересуют, как ...
вопрос задан: 23 May 2017 11:54
2
ответа

Подобие косинуса Векторов различных длин?

Я пытаюсь использовать TF-IDF для сортировки документов в категории. Я вычислил tf_idf для некоторых документов, но теперь когда я пытаюсь вычислить Подобие Косинуса между двумя из этих документов, я добираюсь...
вопрос задан: 23 May 2017 11:54
2
ответа

Частеречная разметка на немецком языке

Я использую NLTK для извлечения существительных из текстовой строки, запускающейся со следующей команды: tagged_text = nltk.pos_tag (nltk. Текст (nltk.word_tokenize (some_string))), Это хорошо работает на английском языке. Есть ли...
вопрос задан: 26 November 2015 16:25
2
ответа

[Закрываются] практические примеры использования NLTK

Я играю вокруг с Инструментарием естественного языка (NLTK). Его документация (Книга и ПРАКТИЧЕСКОЕ РУКОВОДСТВО) является довольно большой, и примеры иногда немного совершенствуются. Там хорошо работают, но являются основными...
вопрос задан: 30 September 2015 11:44
2
ответа

Java Стэнфорд обработка естественного языка: маркировки Части речи?

Обработка естественного языка Стэнфорда, demo'd здесь, дает вывод как это: идеи/NNS Colorless/JJ green/JJ sleep/VBP furiously/RB./. Что означают теги Части речи? Я не могу найти официальный список. Это...
вопрос задан: 11 August 2015 03:27