Я планирую использовать нейронные сети для аппроксимации функции ценности в алгоритме обучения с подкреплением . Я хочу сделать это, чтобы ввести некоторое обобщение и гибкость в том, как я представляю состояния и действия.
Мне кажется, что нейронные сети - правильный инструмент для этого, однако у меня здесь ограниченная видимость, поскольку я не являюсь экспертом в области ИИ. В частности, похоже, что в наши дни нейронные сети заменяются другими технологиями, например поддерживают векторные машины, но я не уверен, является ли это вопросом моды или есть какие-то реальные ограничения в нейронных сетях, которые могут обречь мой подход. У вас есть предложения?
Спасибо,
Tunnuz