Поиск (Python) проекта, который сравнивает обучение в области подкрепления с DeepRL

ember-metal - пространство имен для всех ядровых / базовых методов ember - в основном, это грязные кишки системы.

Вероятно, это ссылка на «разделение на металл», которое удаляет красивые, кричащие и привлекательные части, поэтому у вас есть прочная основа для создания.

-1
задан Boun7yhun7er 19 January 2019 в 15:48
поделиться

1 ответ

Возможно, вы слышали о книге Саттон-Барто о подкрепление-обучение-введение-118 . В этой книге вы найдете много примеров обучения Q с использованием table, а также с neural-network.

Есть также сравнение между многими другими алгоритмами, такими как SARSA, TD, Q, value-function и т. Д. В этой ссылке вы найдете репозиторий кода, который имеет решение почти всех проблем из книги.

Не стесняйтесь задавать вопросы.

0
ответ дан Ankish Bansal 19 January 2019 в 15:48
поделиться
Другие вопросы по тегам:

Похожие вопросы: