Подходит ли
class sklearn.cross_validation.ShuffleSplit(
n,
n_iterations=10,
test_fraction=0.10000000000000001,
indices=True,
random_state=None
)
для 10 * 10-кратного резюме в scikit-learn? (Изменив random_state на 10 разных чисел)
Потому что я не нашел никакого параметра random_state
в стратифицированном K-сгибе
или K-Fold
и отдельные от K-Fold
всегда идентичны для одних и тех же данных.
Если ShuffleSplit
является правильным, одна проблема заключается в том, что он упоминается
Примечание: в отличие от других стратегий перекрестной проверки, случайное разбиение не гарантирует, что все свертки будут отличается, хотя это все еще очень вероятно для больших наборов данных
Всегда ли это так для 10 * 10 кратного CV?