ember-metal - пространство имен для всех ядровых / базовых методов ember - в основном, это грязные кишки системы.
Вероятно, это ссылка на «разделение на металл», которое удаляет красивые, кричащие и привлекательные части, поэтому у вас есть прочная основа для создания.
Возможно, вы слышали о книге Саттон-Барто о подкрепление-обучение-введение-118 . В этой книге вы найдете много примеров обучения Q
с использованием table
, а также с neural-network
.
Есть также сравнение между многими другими алгоритмами, такими как SARSA, TD, Q, value-function и т. Д. В этой ссылке вы найдете репозиторий кода, который имеет решение почти всех проблем из книги.
Не стесняйтесь задавать вопросы.