Как выбрать обучающие данные для наивного байесовского классификатора

Я хочу дважды проверить некоторые концепции, которые я не уверен в отношении обучающего набора для обучения классификаторам. Когда мы выбираем записи для наших обучающих данных, выбираем ли мы равное количество записей для каждого класса, суммируя их до N, или следует случайным образом выбирать N записей (независимо от класса)?

Интуитивно я думал о первом, но думал, что тогда вероятности предыдущих классов будут равны и не будут действительно полезными?

5
задан petezurich 20 August 2018 в 17:53
поделиться