ScheduledThreadPoolExecutor + setXXXXShutdownPolicy ()

Соответствующим вариантом является gcv_mode. Он может принимать 3 значения: «авто», «svd» и «собственный». По умолчанию установлено значение «auto», которое имеет следующее поведение: используйте режим svd, если n_samples> n_features, в противном случае используйте собственный режим.

Так как в вашем случае n_samples> n_features, режим svd выбран. Однако в настоящее время режим svd не обрабатывает разреженные данные должным образом. scikit-learn должен быть исправлен, чтобы использовать правильный разреженный SVD вместо плотного SVD.

В качестве обходного пути я заставил бы собственный режим gcv_mode = «собственный», так как этот режим должен правильно обрабатывать разреженные данные. Тем не менее, n_samples довольно велико в вашем случае. Поскольку собственная мода строит матрицу ядра (и, следовательно, имеет n_samples ** 2 сложности памяти), матрица ядра может не помещаться в память. В этом случае я бы просто уменьшил количество выборок (например, собственный режим может обрабатывать очень большое количество функций без проблем).

В любом случае, поскольку как n_samples, так и n_features достаточно велики, вы (даже с правильным разреженным SVD).

Также см. https://github.com/scikit-learn/scikit-learn/issues/1921

1
задан Jason S 8 October 2010 в 19:15
поделиться