Я создаю инструмент для предсказания времени и стоимости проектов программного обеспечения на основе прошлых данных. Инструмент использует нейронную сеть, чтобы сделать это и до сих пор, результаты обещают, но я думаю, что могу сделать намного больше оптимизации только путем изменения свойств сети. Кажется, нет никаких правил или даже многих лучших практик когда дело доходит до этих настроек поэтому, если бы кто-либо с опытом мог бы помочь мне, я был бы очень признателен за его.
Входные данные составлены из серии целых чисел, которые могли повыситься настолько высоко, как пользователь хочет пойти, но большинство будет находиться под 100,000, я думал бы. Некоторые будут всего 1. Они - детали как число людей на проекте и стоимости проекта, а также детали об объектах базы данных и вариантах использования.
Существует 10 исходных данных всего и 2 вывода (время и стоимость). Я использую Устойчивое Распространение для обучения сети. В настоящее время это имеет: 10 входных узлов, 1 скрытый слой с 5 узлами и 2 выходными узлами. Я - обучение получить менее чем 5%-й коэффициент ошибок.
Алгоритм должен работать на веб-сервере, таким образом, я поместил в какой-то мере для остановки обучения, когда похоже, что это не идет никуда. Это установлено на 10 000 учебных повторений.
В настоящее время, когда я пытаюсь обучить его с некоторыми данными, которые немного варьируются, но хорошо в рамках того, что мы ожидаем, что пользователи поместят в него, требуется много времени для обучения, поражая 10 000 итеративных пределов много раз.
Это - первый раз, когда я использовал нейронную сеть, и я действительно не знаю, что ожидать. Если Вы могли бы дать мне некоторые подсказки, какие настройки я должен использовать для сети и для итеративного предела, я был бы очень признателен за его.
Спасибо!
Прежде всего, спасибо за столько информации о своей сети! Вот несколько советов, которые должны дать вам более ясную картину.
0
с и 1
с, чем с непрерывными функциями.Если это первое, я бы рекомендовал использовать функцию активации сигмовидной кишки. Комбинация функций активации tanh
и linear
для скрытого и выходного уровней, как правило, хорошо справляется с непрерывно изменяющимися данными.