Я читал кое-что о нейронных сетях и понимаю общий принцип однослойной нейронной сети. Я понимаю необходимость дополнительных слоев, но почему используются нелинейные функции активации?
За этим вопросом следует следующий: Для чего используется производная функции активации при обратном распространении?