4
ответа

Как извлечь распространенный / значительные фразы от ряда вводов текста

У меня есть серия текстовых объектов - необработанный HTML от базы данных MySQL. Я хочу найти наиболее распространенные фразы в этих записях (не единственная наиболее распространенная фраза, и идеально, не осуществляя слово в слово...
вопрос задан: 26 November 2017 10:40
2
ответа

Обработка естественного языка: Качественно “положительный” по сравнению с “отрицательным” предложением

Я нуждаюсь в Вашей помощи в определении лучшего подхода для того, чтобы проанализировать отраслевые предложения (т.е. обзоры фильмов) для "положительного" по сравнению с "отрицательным". Я видел библиотеки, такие как OpenNLP прежде, но
вопрос задан: 23 September 2008 17:51
1
ответ

поколение тега от маленького текстового содержания (такого как твиты)

Я уже задал подобный вопрос ранее, но я заметил, что имею большой, ограничьте: Я работаю над маленьким текстовым suchs наборов как пользовательские Твиты для генерации тегов (ключевые слова). И это походит...
вопрос задан: 23 May 2017 10:30
1
ответ

Как найти общие фразы в большом теле текста

Я работаю над проектом в данный момент, где я должен выбрать наиболее распространенные фразы в огромном теле текста. Например, скажите, что у нас есть три предложения как следующее: собака, через которую перепрыгивают...
вопрос задан: 18 December 2009 23:32
0
ответов

Полезные функции, используемые в сентиментальном анализе

Я работаю над проектом «Анализ текста», а именно «Сентиментальное обнаружение». Я новичок в этом вопросе, поэтому я хотел бы спросить вас, какие самые важные, необходимые и полезные функции используются для чистых ...
вопрос задан: 13 July 2018 20:39
0
ответов

Корреляция слов в R

Я вижу некоторые подобные вопросы, но никто из них не помог мне. У меня есть корпус, и я хочу иметь список, таблицу или фрейм данных с самой высокой и самой низкой позитивной и отрицательной корреляцией ...
вопрос задан: 13 July 2018 17:54
0
ответов

Как автоматически определять теги (ключевые слова) из заданного текста?

Она должна вести себя так же, как панель инструментов Delicious для Firefox; он перечисляет возможные теги для нажатия. Эффект показан ниже: Код должен уметь находить ключевые слова для текста. Любой хороший алгоритм или ...
вопрос задан: 23 May 2017 12:13
0
ответов

Удаление «пустого» символа из корпуса документов в R?

Я использую пакеты tm и lda в R для тематического моделирования свода новостных статей. Тем не менее, я получаю проблему «не символа -», представленную как «», которая портит мои темы. Вот мой рабочий процесс :...
вопрос задан: 7 May 2012 20:10
0
ответов

Эффективный лемматизатор, который избегает поиска в словаре

Я хочу преобразовать строку типа «есть» в «есть», «ест». Я искал и нашел лемматизацию как решение, но все инструменты лемматизатора, с которыми я сталкивался, используют список слов или поиск по словарю ....
вопрос задан: 12 December 2011 09:03
0
ответов

Обучающие данные для анализа настроений [закрыто]

Где я могу получить корпус документов, которые уже были классифицированы как положительные / отрицательные по настроениям в корпоративной сфере? Мне нужен большой корпус документов, содержащих обзоры для ...
вопрос задан: 27 September 2011 01:36
0
ответов

Как сделать свойство maxSession конфигурируемым для определенного MDB в JBoss EAP 5,1

Как сделать значение maxSession настраиваемым пользователем MDB? Существует MDB, который прослушивает сообщение из определенной очереди. Он определяется как аннотация. @ ActivationConfigProperty (propertyName = "...
вопрос задан: 7 September 2011 10:20
0
ответов

Библиотеки анализа текста Java

Я ищу управляемое Java решение для требования анализа предложений для регистрации того, было ли ключевое слово использовано положительно или отрицательно. Т.е. ключевым словом может быть «капуста» и предложение: - «...
вопрос задан: 23 September 2010 12:35