Ссылки для нормализации данных

Каковы наилучшие методы нормализации данных (не уверен, что это правильный термин) для сетевых сетей и других алгоритмов машинного обучения? Я имею в виду, как вы представляете данные в NN / algo.

Например, как вы представляете код магазина? Магазин 555 не больше и не меньше 554, это всего лишь классификация. Модели NN / алгоритмов просто отфильтровывают это самостоятельно или вам нужно подтолкнуть их к тому, чтобы они сделали классификацию, а не математические различия?

Спасибо за любую помощь в направлении меня к соответствующей информации. Я, очевидно, новичок в этом.

РЕДАКТИРОВАТЬ : Спасибо всем за ответы. Я рылся в довольно большом количестве книг по интеллектуальному анализу данных, и хотя я нашел несколько, в которых глава или две посвящены теме предварительной обработки данных, я немного удивлен тем, как большинство полностью игнорирует ее. Еще раз спасибо.

6
задан petezurich 21 August 2018 в 05:12
поделиться