[Закрываются] большие наборы данных

Просто внесите изменения в database.php файл

$db['default']['dbdriver'] = 'mysql';

в

$db['default']['dbdriver'] = 'mysqli';
11
задан Ryan Gates 1 October 2013 в 04:44
поделиться

7 ответов

Проверьте конкурс Netflix. Я полагаю, что они выставили свою базу данных или большое подмножество, для упрощения конкурса.

ОБНОВЛЕНИЕ: Их часто задаваемые вопросы говорят, что у них есть 100 миллионов записей в подмножестве, которое можно загрузить.

10
ответ дан 3 December 2019 в 05:14
поделиться

Вы могли бы хотеть взглянуть на данные для американских Статистических данных Ассоциации экспо - это - детали полета для всех коммерческих полетов в США в течение прошлых 20 лет - 120 миллионов записей, 11 ГБ данных.

5
ответ дан 3 December 2019 в 05:14
поделиться

Я сделал некоторую работу с наборами загрузки Викимедиа, которые являются огромными XML-файлами. К сожалению, их сервер загрузки, кажется, в настоящее время имеет дисковое пространство проблемы столь многие наборы данных, не доступны. Но когда это доступно, весь английский набор данных Википедии с полной историей составляет 2,8 ТБ (сжатых 18 ГБ).

2
ответ дан 3 December 2019 в 05:14
поделиться

Много del.icio.us пользователей (включая меня) отмечают страницы, которые содержат общедоступные данные с помощью тега "publicdata". Можно найти, что архив здесь и подписывается на канал RSS для того тега здесь. Подпишитесь на канал, и Вы будете видеть непрекращающийся поток интересных наборов данных, которые открываются в сети.

Не все те наборы данных являются большими, но они часто интересны.

2
ответ дан 3 December 2019 в 05:14
поделиться

Вы могли бы хотеть посмотреть на генерацию случайных данных для Тестирования Пуха. Это дало бы Вам в значительной степени неограниченную сумму данных тестирования, и Вы, более вероятно, поразите пограничные случаи.

Возможно, еще некоторая информация о том, какие данные тестирования Вы хотите, что формат, и для какой типы приложений?

1
ответ дан 3 December 2019 в 05:14
поделиться

Я не знаю, какова Ваша целевая платформа, но если Вы разрабатываете против Visual Studio выезда базы данных MSSQL для Профессионалов Базы данных. Это имеет очень замечательную функцию, где это может генерировать данные для Вашей схемы с помощью плана данных, который можно определить.

Redgate также имеет datageneration инструмент, но я не использовал его.

Преимущество состоит в том, что можно создать план поколения данных и использовать его для заполнения базы данных с последовательными, большими объемами данных, которые могут быть настроены для тестирования определенных областей схемы.

1
ответ дан 3 December 2019 в 05:14
поделиться

Вы могли бы также хотеть проверить theinfo Aaron Swartz.

От сайта

Это - сайт для больших наборов данных и людей, которые любят их: скребки и поисковые роботы, кто собирает их, академиков и фанатов, которые обрабатывают их, разработчиков и художников, которые визуализируют их. Это - место, где они могут обмениваться подсказками и приемами, разработать и совместно использовать инструменты вместе и начать интегрировать свои конкретные проекты.

1
ответ дан 3 December 2019 в 05:14
поделиться
Другие вопросы по тегам:

Похожие вопросы: