Я хочу дважды проверить некоторые концепции, которые я не уверен в отношении обучающего набора для обучения классификаторам. Когда мы выбираем записи для наших обучающих данных, выбираем ли мы равное количество записей для каждого класса, суммируя их до N, или следует случайным образом выбирать N записей (независимо от класса)?
Интуитивно я думал о первом, но думал, что тогда вероятности предыдущих классов будут равны и не будут действительно полезными?