3
ответа

Ошибка Input_size в LSTM PyTorch: RuntimeError: форма ‘[10, 30, 1]’ недопустима для ввода размера 150

все, я использую LSTM, чтобы предсказать фондовый индекс когда-нибудь, используя данные за 30 дней до него в качестве входных данных. Я думаю, что в этом примере размер ввода LSTM должен быть [10,30,1], поэтому я использую t_x = ...
вопрос задан: 10 March 2019 02:12
2
ответа

Python, Keras - ValueError: Невозможно передать значение формы (10, 70, 1025) для Tensor u'dense_2_target: 0 ', который имеет форму' (?,?) '

Я пытаюсь тренировать РНН партиями. Размер входного входа (10, 70, 3075), где 10 - размер пакета, 70 - измерение времени, 3075 - измерение частоты Есть три выхода, размер которых (...
вопрос задан: 18 January 2019 20:21
1
ответ

Простой возврат данных RNN в Pytorch

Я изучаю Pytorch и пытаюсь создать сеть, способную запоминать предыдущие данные. Я пробовал 2 разных структуры ввода / вывода (см. Ниже), но не получил ничего, чтобы работать так, как я бы ...
вопрос задан: 18 March 2019 15:48
1
ответ

Если небольшая нейронная сеть использовалась в качестве функции оценки для модели Attention, против какой метки / значения она обучалась?

Я читаю статью о механизме внимания архитектуры кодера-декодера для машинного перевода. Было несколько предложений для функции оценки для шага декодирования, такой как косинус ...
вопрос задан: 10 March 2019 00:25
1
ответ

В чем разница между состоянием возврата и последовательностью возврата в слое keras GRU?

Я не могу обернуть голову вокруг разницы между состоянием возврата и последовательностью возврата в слое keras GRU. Поскольку у блока GRU нет состояния ячейки (оно равно выходному сигналу), как ...
вопрос задан: 26 February 2019 15:23
1
ответ

Tensorflow: низкоуровневая реализация LSTM

Я ищу низкоуровневую реализацию RNN с ячейками LSTM в Tensorflow. Я уже реализовал несколько сетей с прямой связью, где использовал низкоуровневые API. Это очень помогло мне понять ...
вопрос задан: 20 January 2019 09:27
1
ответ

Предупреждение Tensorflow: две ячейки, предоставленные MultiRNNCell, являются одним и тем же объектом

Я постоянно получаю следующее предупреждение при выполнении сценариев tenorflow. ПРЕДУПРЕЖДЕНИЕ: tenorflow: как минимум две ячейки, предоставленные MultiRNNCell, являются одним и тем же объектом и будут совместно использовать ...
вопрос задан: 19 January 2019 17:15
1
ответ

Python двоичная RNN классификация координат временных рядов

Я пытался создать RNN. Всего у меня есть набор данных из 1661 отдельных «записей» с 158 координатами временных рядов в каждой из этих записей. Ниже приведена небольшая часть одной записи: ...
вопрос задан: 18 January 2019 22:17
1
ответ

В настоящее время я пишу функцию Xpredict, которая является оболочкой для функции keras.predict () для всей модели keras в целом.

Я хотел бы знать, как я могу найти соответствующее имя класса предсказаний? Generator.class_indices работает для нескольких моделей, в которых данные поступают из генератора. Однако для немногих ...
вопрос задан: 18 January 2019 21:00
1
ответ

Как смоделировать RNN с механизмом внимания для нетекстовой классификации?

Рекуррентные нейронные сети (RNN) с механизмом внимания обычно используются для машинного перевода и обработки естественного языка. В Python реализация RNN с механизмом внимания является ...
вопрос задан: 17 January 2019 14:29
1
ответ

Что именно является временным шагом в модели LSTM?

Я новичок в LSTM и RNN в целом, я ломал голову, чтобы понять, что именно является временным шагом. Я был бы очень признателен за интуитивное объяснение этого
вопрос задан: 17 January 2019 12:20
1
ответ

Почему выходные данные моего слоя не совпадают с размерами, показанными в сводке по моей модели?

Мне удалось создать успешный RNN, который может предсказать следующую букву в последовательности букв. Однако я не могу понять, почему работает решение проблемы, с которой я столкнулся. Мои данные о тренировках ...
вопрос задан: 16 January 2019 22:14
0
ответов

Невозможно продолжить обучение модели после загрузки

Я новичок в tenorflow. у меня проблема в том, что я получаю ошибку после загрузки модели с контрольной точки и продолжаю обучать ее, еще одна вещь, кроме ошибки, что точность проверки равна нулю, как будто это ...
вопрос задан: 13 April 2019 11:55
0
ответов

Был ли кто-нибудь реализовал документ ‘« Неконтролируемое обучение видео-представлений с использованием LSTM »в Керасе?

Everypone. «Сейчас я работаю над документом« Необучаемое изучение видеопрезентаций с использованием LSTM ». Но мой результат не очень хорош.
вопрос задан: 28 March 2019 04:22
0
ответов

Ошибка с автономным cudnnRNNForwardTraining

ОШИБКА: CUDNN_BAD_PARAM Я пытаюсь написать автономную версию для cudnnRNNForwardTraining. Получение плохого параметра. Это значения дескриптора перед вызовом cudnnRNNForwardTraining. Что может быть ...
вопрос задан: 20 March 2019 08:37
0
ответов

Как создать модель языка LSTM или RNN N-GRAM в API Tensorflow C ++

Как я могу создать языковую модель LSTM или RNN N-Gram в Tensorflow C ++ API? Моя цель состоит в том, чтобы получить количество вхождений слова (ngram), используя модель LSTM или RNN.
вопрос задан: 19 January 2019 18:56
0
ответов

Как управлять состоянием кодера в многослойном двунаправленном режиме с помощью механизма внимания

Я реализую модель Seq2Seq с многоуровневым двунаправленным механизмом взаимодействия и внимания, и, следуя этому руководству https://github.com/tensorflow/nmt, я запутался в том, как манипулировать ...
вопрос задан: 17 January 2019 09:06
0
ответов

Как я могу реализовать несколько скрытых слоев в RNN (PyTorch)?

Мой Pytorch RNN для классификации имен не позволяет мне выбирать несколько скрытых слоев. Если я выбираю более 1 слоя, я получаю следующее сообщение об ошибке: Traceback (последний вызов был последним): File "...
вопрос задан: 17 January 2019 09:03
0
ответов

Влияет ли упаковка-вкладка на точность?

Я попробовал технику пак-пад. Это сильно сокращает время вычислений, но моя точность значительно хуже прежней. Это звучит разумно с теорией приближений, которые дольше вычисляют ...
вопрос задан: 17 January 2019 06:32
0
ответов

Модель RNN может запомнить предыдущий текст на этапе прогнозирования

Я разработал проблему классификации текста с использованием RNN, keras и python. Вот моя главная проблема в том, что я могу классифицировать текст после подгонки модели.
вопрос задан: 16 January 2019 09:24
0
ответов

Как выполняется развертывание LSTM, когда каждое развертывание занимает один кадр изображения?

В настоящее время я пытаюсь реализовать следующий документ: https://research.nvidia.com/sites/default/files/publications/dnn_denoise_author.pdf Мои данные имеют следующую форму: (7, 512, 512, 1), где 7 ...
вопрос задан: 15 January 2019 15:11
0
ответов

Использование текущих нейронных сетей для прогнозирования банковских данных

Мне было интересно, можно ли смоделировать маркетинговый набор данных банка репозитория UCI ML с помощью рекуррентной нейронной сети. Функции ввода представляют собой упорядоченную по времени последовательность примеров ...
вопрос задан: 31 December 2018 08:41
0
ответов

Можно ли использовать популярные оптимизаторы Neural Networks, такие как Adam, с входами переменной длины?

Допустим, у нас есть RNN с входами, которые могут иметь очень разную длину. Один вход может быть batch_size x 13 x num_features, другой может быть batch_size x 150 x num_features. Потери накапливаются ...
вопрос задан: 13 July 2018 08:34
0
ответов

В чем разница между тензорным потоком dynamic_rnn и rnn?

В tf.nn есть несколько классов, которые относятся к RNN. В примерах, которые я нахожу в Интернете, tf.nn.dynamic_rnn и tf.nn.rnn, кажется, используются взаимозаменяемо, или, по крайней мере, я не могу понять, почему ...
вопрос задан: 8 July 2018 23:06
0
ответов

Много к одному и много ко многим примерам LSTM в Керасе

Я пытаюсь понять LSTM и как их построить с помощью Keras. Я обнаружил, что есть в основном 4 режима для запуска RNN (4 правильных на картинке) Источник изображения: Андрей Карпати Теперь я ...
вопрос задан: 27 February 2018 23:01
0
ответов

В чем разница между двунаправленным LSTM и LSTM?

Может кто-нибудь, пожалуйста, объясните это? Я знаю, что двунаправленные LSTM имеют прямой и обратный проход, но в чем их преимущество перед однонаправленным LSTM? Для чего лучше подходит каждый из них?
вопрос задан: 26 March 2017 23:31
0
ответов

Прогнозирование временных рядов с помощью нейронных сетей

В последнее время я работал над нейронными сетями для различных целей. Я добился больших успехов в распознавании цифр, XOR и других приложениях easy / hello world'ish. Я хотел бы заняться…
вопрос задан: 28 December 2015 21:54