15
ответов

Не удалось решить эту ошибку: ImportError [duplicate]

file0 = open ('wiki0.txt', 'r') content = file0.readlines () file1 = open ('wiki1.txt', 'r') content = file1.readlines () file2 = open ('wiki2.txt ',' r ') content = file2.readlines () file3 = open (' wiki3.txt ',' r ') ...
вопрос задан: 10 August 2014 09:35
2
ответа

Как преобразовать dataframe в класс S4 в R? [Дубликат]

Как преобразовать dataframe в класс S4 в R? Как читать каждую строку данных в качестве объекта в классе S4?
вопрос задан: 11 May 2013 23:59
1
ответ

Построение тематической модели LDA по годам

Я пытаюсь построить темы для твитов по годам из этого файла. ...
вопрос задан: 3 March 2019 12:00
1
ответ

Тематическое моделирование: LDA и BTM

Кто-нибудь знает здесь о теме моделирования? Мне очень нужна помощь. 1) Что такое тематическое моделирование 2) Что такое скрытое распределение Дирихле и тематическое моделирование Biterm? 3) В чем разница между LDA и ...
вопрос задан: 15 January 2019 19:52
1
ответ

Удаление стоп-фраз из DocumentTermMatrix

Ниже я делаю базовое моделирование темы для «грубых» данных. Я знаю, что могу удалить стоп-слова, используя tm_map, но я не могу понять, как это сделать после того, как происходит токенизация bigram. библиотека (topicmodels) ...
вопрос задан: 13 July 2018 19:19
1
ответ

добавить docvars в dfm из отдельных данных.

Проведя много времени на разработку соответствующего корпуса (например, стоп-слова, tf-idf), я создал dtm в tmpackage и запустил мою тему. Затем я начал сравнивать темы с некоторым уровнем документа ...
вопрос задан: 13 July 2018 15:10
0
ответов

Настройка реализации LDA Random_Seed LDA (для воспроизводимости результатов)

Могу ли я узнать, какая версия LDA Mallet Wrapper имеет параметр random_seed, включенный в код? Я пробовал версию Mallet 2.0.8, но я получаю неожиданный аргумент TypeError. Или я должен ...
вопрос задан: 5 March 2019 17:06
0
ответов

как оптимизировать вложенный цикл в lda, код модели темы в r

Я пишу код алгоритма моделирования тем LDA. Я передал входные данные clean_corp, как показано в приведенном ниже коде, содержащем твиты. Выходные данные - матрица wt (слово-тема) и матрица dt (тема-документ) ... все должно работать ...
вопрос задан: 19 January 2019 17:44
0
ответов

Простая реализация Python совместного моделирования темы?

Я наткнулся на эти 2 статьи, в которых сочетаются совместная фильтрация (матричная факторизация) и тематическое моделирование (LDA), чтобы рекомендовать пользователям похожие статьи / сообщения на основе тематических терминов сообщения / статей ...
вопрос задан: 30 June 2016 17:05
0
ответов

Тематическое моделирование LDA — обучение и тестирование

Я прочитал LDA и понимаю математические принципы создания тем при вводе набора документов. В ссылках говорится, что LDA — это алгоритм, который при наличии набора...
вопрос задан: 2 June 2016 19:55
0
ответов

Почему получаются разные результаты при выводе темы MALLET для одного и пакета документов?

Я пытаюсь выполнить моделирование темы LDA с помощью Mallet 2.0.7. Я могу обучить модель LDA и получить хорошие результаты, судя по результатам тренировки. Кроме того, я могу использовать встроенный в ...
вопрос задан: 3 April 2013 23:29
0
ответов

Пример решения для скрытого распределения Дирихле

Я пытаюсь узнать о скрытом распределении Дирихле (LDA). У меня есть базовые знания в области машинного обучения и теории вероятностей, и на основе этого сообщения в блоге http://goo.gl/ccPvE я смог разработать ...
вопрос задан: 19 March 2013 13:05
0
ответов

Удаление «пустого» символа из корпуса документов в R?

Я использую пакеты tm и lda в R для тематического моделирования свода новостных статей. Тем не менее, я получаю проблему «не символа -», представленную как «», которая портит мои темы. Вот мой рабочий процесс :...
вопрос задан: 7 May 2012 20:10
0
ответов

Тематическое моделирование в Mallet; Документация

Я ищу хорошую документацию для Mallet, особенно для его классов, связанных с тематическим моделированием. Я просмотрел документы Java, но они не слишком полезны. Например: оценка общественности ...
вопрос задан: 27 April 2012 16:49