Длинные предложения не подходят для моделей глубокого обучения?

Потому что вы могли бы сделать это с определенной целью. Это не примитив. Может быть, конструктор и деструктор делают что-то важное?

У MFC даже были классы, которые работали таким образом, вы могли бы сделать это:

void foo()
{
    CWaitCursor cursor;

    [...]
}

Это отобразило бы значок песочных часов на время функция.

0
задан echan00 18 January 2019 в 10:11
поделиться

1 ответ

В идеале, обучающие данные должны иметь такое же распределение длин предложений, как и целевые тестовые данные. Например. в машинном переводе, если длинные предложения предназначены для перевода по окончательной модели, аналогично длинные предложения следует использовать и для обучения. Модель Transformer, по-видимому, не обобщает более длинные предложения, чем те, которые использовались для обучения, но ограничение максимальной длины предложения в обучении позволяет использовать более крупные размеры пакетов, что полезно ( Popel and Bojar, 2018 ). [111 ]

0
ответ дан Martin Popel 18 January 2019 в 10:11
поделиться
Другие вопросы по тегам:

Похожие вопросы: