как обратное распространение такое же (или нет), как обратное автоматическое дифференцирование?

Страница Википедии для обратного распространения имеет следующее утверждение:

Алгоритм обратного распространения для вычисления градиента был повторно обнаружен несколько раз и является частным случаем более общая техника называется автоматическим дифференцированием в режиме обратного накопления.

Может кто-то объяснить это, выразить это с точки зрения непрофессионала? Какая функция дифференцируется? Что такое «особый случай»? Используются ли сами сопряженные значения или конечный градиент?

10
задан nealmcb 12 June 2017 в 01:21
поделиться