линейная регрессия с использованием категорий в качестве признаков

Я пытаюсь собрать модель линейной регрессии, но некоторые из моих характеристик не являются числовыми, например. «Цвет автомобиля», тогда как другие, например. "Размер двигателя". В числовых случаях, отличных от -, я не уверен, как представить это при добавлении в качестве входной функции. Единственный способ, которым я мог бы это сделать, - представить каждый цвет с другим значением, например. (красный = 1, синий = 2, зеленый = 3... )однако это не кажется приемлемым, поскольку подразумевает, что зеленый "лучше" красного.

Может ли кто-нибудь помочь... Я реализую это на Java, поэтому я был бы признателен за алгоритмы, выраженные на этом языке, или за независимость от языка.

5
задан Makoto 29 July 2012 в 15:14
поделиться