fetch_mldata
будет по умолчанию проверять данные в `` ~ / scikit_learn_data / mldata ', чтобы узнать, загружен ли набор данных или нет.
Согласно исходному коду
# if the file does not exist, download it
if not exists(filename):
urlname = MLDATA_BASE_URL % quote(dataname)
Итак, в вашем случае он проверит местоположение
~/scikit_learn_data/mldata/mnist-original.mat
, и если он не найден, он будет загружен из
http://mldata.org/repository/data/download/matlab/mnist-original.mat
, который в настоящее время не работает, как вы подозревали.
Итак, что вы можете сделать, это загрузить набор данных из любого другого местоположения, подобного этому:
https://github.com/amplab/datascience-sp14/blob/master/lab7/mldata/mnist-original.mat
и сохранить это в указанной выше папке.
После этого при запуске fetch_mldata()
он должен выбрать загруженный набор данных без подключения mldata.org.
Здесь ~
относится к домашняя папка пользователя. Вы можете использовать следующий код, чтобы узнать местоположение по умолчанию этой папки в соответствии с вашей системой.
from sklearn.datasets import get_data_home
print(get_data_home())
Нашел решение: установите testURL на локальный порт, а затем обслужите файлы с http-сервером / express или чем-то еще подобным на этом порту.