Каковы наилучшие методы нормализации данных (не уверен, что это правильный термин) для сетевых сетей и других алгоритмов машинного обучения? Я имею в виду, как вы представляете данные в NN / algo.
Например, как вы представляете код магазина? Магазин 555 не больше и не меньше 554, это всего лишь классификация. Модели NN / алгоритмов просто отфильтровывают это самостоятельно или вам нужно подтолкнуть их к тому, чтобы они сделали классификацию, а не математические различия?
Спасибо за любую помощь в направлении меня к соответствующей информации. Я, очевидно, новичок в этом.
РЕДАКТИРОВАТЬ : Спасибо всем за ответы. Я рылся в довольно большом количестве книг по интеллектуальному анализу данных, и хотя я нашел несколько, в которых глава или две посвящены теме предварительной обработки данных, я немного удивлен тем, как большинство полностью игнорирует ее. Еще раз спасибо.