2
ответа

Установите Gensim в python3

У меня есть две версии python: python2, python3. Когда я устанавливаю gensim, он переходит на python2. Я устанавливаю его с помощью следующей команды sudo pip3 install --upgrade gensim, как я могу установить его на python3? ...
вопрос задан: 15 January 2019 15:40
1
ответ

Как правильно получить значения векторов документов?

Как я могу получить конкретные значения вектора документа? По тегу, например: modelValues ​​= model.docvecs ['myDocTag'] или это возможно только по индексу, например: modelValues ​​= model.docvecs [12] (в последнем случае я ...
вопрос задан: 11 March 2019 13:47
1
ответ

Потоковая передача на векторизатор в конвейере

У меня большой языковой корпус, и я использую векторизатор sklearn tfidf и gensim Doc2Vec для вычисления языковых моделей. В моем общем корпусе около 100 000 документов, и я понял, что мой блокнот Jupyter ...
вопрос задан: 31 January 2019 19:06
1
ответ

Загрузите словарь word2vec в gensim

Я загрузил предварительно обученные вложения word2vec в словарь python в форме {word: vector}. Например, элементом этого словаря является w2v_dict ["house"] = [1.1,2.0, ..., 0.2] Я хотел бы ...
вопрос задан: 21 January 2019 12:32
1
ответ

Как повернуть word2vec на другой word2vec?

Я тренирую несколько моделей word2vec с Gensim. Каждый из слова2vec будет иметь одинаковые параметры и размерность, но тренироваться с немного разными данными. Затем я хочу сравнить, как изменение в ...
вопрос задан: 13 July 2018 17:35
1
ответ

TypeError: doc2bow ожидает массив токенов unicode на входе, а не одну строку [duplicate]

Я искал все предложения, где каждый говорит, чтобы сломать строку в токены с помощью функции split. Все, что уже сделано, но все же кажется, что у него такая же ошибка снова и снова. для r в ...
вопрос задан: 20 October 2015 06:20
0
ответов

Что хранится в сходствах. SparseMatrixS Similarity (). Index

Я использую косинусную функцию подобия в модуле gensim, которая является сходством И я хочу получить сходство между всеми индексными документами. У метода есть атрибут: index, ...
вопрос задан: 17 January 2019 03:37
0
ответов

Ошибка вызова Numpy, Scipy, Gensim в python3

Почему, когда я звоню Numpy, Scipy, Gensim с python3 в Linux, у меня появляется следующая ошибка? > import gensim _concrete_types = {v.type для k, v в _concrete_typeinfo.items ()} AttributeError: 'tuple' ...
вопрос задан: 15 January 2019 11:49
0
ответов

Gensim: Как сохранить созданные темы модели LDA в удобочитаемом формате (csv, txt и т. Д.)?

последние части кода: lda = LdaModel (корпус = корпус, id2word = словарь, num_topics = 2) печать вывода lda bash: INFO: добавление документа № 0 в словарь (0 уникальных токенов) INFO: встроенный словарь (18 ...
вопрос задан: 16 August 2016 04:42
0
ответов

Поиск тем невидимого документа через Gensim

Я использую Gensim для крупномасштабного -тематического моделирования. Мне трудно понять, как определить прогнозируемые темы для невидимого (не -не проиндексированного )документа. Например :У меня 25 млн...
вопрос задан: 14 July 2012 13:02