Как получить окончательное уравнение, которое алгоритм Random Forest использует для ваших независимых переменных для прогнозирования вашей зависимой переменной?

Как всегда, часто задаваемые вопросы о генераторах Java-генератора Angelika Langer подробно объясняются . (Прокрутите к «Почему компилятор иногда выдает предупреждение без предупреждения при вызове метода« varargs »?» - идентификатор не работает хорошо.)

В принципе, вы в конечном итоге теряете информацию в худшем чем обычно. Еще одна небольшая болевая точка в Java-дженериках: (

0
задан desertnaut 16 January 2019 в 10:18
поделиться

2 ответа

Не существует общего способа получить интерпретируемое уравнение из случайного леса, объясняющего, как ваши ковариаты влияют на зависимую переменную. Для этого вы можете использовать другую модель, более подходящую, например, линейную регрессию (возможно, с функциями ядра) или дерево решений. Обратите внимание, что вы можете использовать одну модель для прогнозирования и одну модель для описательного анализа - нет никакой внутренней причины придерживаться одной модели.

используйте Random Forest, чтобы предсказать мою зависимую переменную, чтобы понять, насколько важна каждая независимая переменная

Понимание важности каждой зависимой переменной не обязательно означает, что вам нужен вопрос в заголовке вашего вопроса, а именно получение фактических отношений. У большинства пакетов случайных лесов есть метод количественной оценки степени влияния каждого ковариата на модель в наборе поездов.

0
ответ дан Ami Tavory 16 January 2019 в 10:18
поделиться

Существует ряд методов оценки важности характеристик на основе обученной модели. Для случайного леса наиболее известными методами являются MDI (среднее снижение примеси) и MDA (среднее снижение точности). Многие популярные библиотеки ML поддерживают оценку важности функций из коробки для Random Forest.

0
ответ дан Michael 16 January 2019 в 10:18
поделиться
Другие вопросы по тегам:

Похожие вопросы: