Лучший способ объединить вложение Word, чтобы получить вложение предложения

Используйте это.

@Column( name = "CONTENT" )
@Lob(type = LobType.BLOB)
private byte[] content;

ПРИМЕЧАНИЕ: вышеупомянутый подход зависит от версии спящего режима, аннотация Лоба может не иметь параметра типа. цитата отсюда: @Lob больше не имеет атрибутов, догадывается тип lob (CLOB, BLOB). Если базовый тип - это String или массив символов, то CLOB используются. Используются утилиты BLOB.

1
задан InAFlash 20 January 2019 в 09:23
поделиться

1 ответ

Если вам нужен простой, но эффективный подход, Sif Embedding отлично подойдет. Он усредняет вектор слов в предложении и удаляет его первый главный компонент. Это намного превосходит усреднение векторов слов. Код доступен онлайн здесь . Вот основная часть:

svd = TruncatedSVD(n_components=1, random_state=rand_seed, n_iter=20)
svd.fit(all_vector_representation)
svd = svd.components_

XX2 = all_vector_representation - all_vector_representation.dot(svd.transpose()) * svd

Где all_vector_representation - среднее вложение всех предложений в ваш набор данных.

Существуют и другие сложные подходы, такие как ELMO , Transformer и т. Д.

0
ответ дан Amir 20 January 2019 в 09:23
поделиться
Другие вопросы по тегам:

Похожие вопросы: