gensim - список вопросов по программированию gensim

2

ответа

Установите Gensim в python3

У меня есть две версии python: python2, python3. Когда я устанавливаю gensim, он переходит на python2. Я устанавливаю его с помощью следующей команды sudo pip3 install --upgrade gensim, как я могу установить его на python3? ...

python gensim

вопрос задан: 15 January 2019 15:40

1

ответ

Как правильно получить значения векторов документов?

Как я могу получить конкретные значения вектора документа? По тегу, например: modelValues = model.docvecs ['myDocTag'] или это возможно только по индексу, например: modelValues = model.docvecs [12] (в последнем случае я ...

python gensim doc2vec

вопрос задан: 11 March 2019 13:47

1

ответ

Потоковая передача на векторизатор в конвейере

У меня большой языковой корпус, и я использую векторизатор sklearn tfidf и gensim Doc2Vec для вычисления языковых моделей. В моем общем корпусе около 100 000 документов, и я понял, что мой блокнот Jupyter ...

scikit-learn streaming gensim corpus

вопрос задан: 31 January 2019 19:06

1

ответ

Загрузите словарь word2vec в gensim

Я загрузил предварительно обученные вложения word2vec в словарь python в форме {word: vector}. Например, элементом этого словаря является w2v_dict ["house"] = [1.1,2.0, ..., 0.2] Я хотел бы ...

nlp gensim word2vec spacy word-embedding

вопрос задан: 21 January 2019 12:32

1

ответ

Как повернуть word2vec на другой word2vec?

Я тренирую несколько моделей word2vec с Gensim. Каждый из слова2vec будет иметь одинаковые параметры и размерность, но тренироваться с немного разными данными. Затем я хочу сравнить, как изменение в ...

gensim word2vec word-embedding

вопрос задан: 13 July 2018 17:35

1

ответ

TypeError: doc2bow ожидает массив токенов unicode на входе, а не одну строку [duplicate]

Я искал все предложения, где каждый говорит, чтобы сломать строку в токены с помощью функции split. Все, что уже сделано, но все же кажется, что у него такая же ошибка снова и снова. для r в ...

python tokenize gensim corpus

вопрос задан: 20 October 2015 06:20

0

ответов

Что хранится в сходствах. SparseMatrixS Similarity (). Index

Я использую косинусную функцию подобия в модуле gensim, которая является сходством И я хочу получить сходство между всеми индексными документами. У метода есть атрибут: index, ...

gensim cosine-similarity

вопрос задан: 17 January 2019 03:37

0

ответов

Ошибка вызова Numpy, Scipy, Gensim в python3

Почему, когда я звоню Numpy, Scipy, Gensim с python3 в Linux, у меня появляется следующая ошибка? > import gensim _concrete_types = {v.type для k, v в _concrete_typeinfo.items ()} AttributeError: 'tuple' ...

python python-3.x numpy scipy gensim

вопрос задан: 15 January 2019 11:49

0

ответов

Gensim: Как сохранить созданные темы модели LDA в удобочитаемом формате (csv, txt и т. Д.)?

последние части кода: lda = LdaModel (корпус = корпус, id2word = словарь, num_topics = 2) печать вывода lda bash: INFO: добавление документа № 0 в словарь (0 уникальных токенов) INFO: встроенный словарь (18 ...

python lda gensim

вопрос задан: 16 August 2016 04:42

0

ответов

Поиск тем невидимого документа через Gensim

Я использую Gensim для крупномасштабного -тематического моделирования. Мне трудно понять, как определить прогнозируемые темы для невидимого (не -не проиндексированного )документа. Например :У меня 25 млн...

gensim nlp python latent-semantic-indexing

вопрос задан: 14 July 2012 13:02