У меня большой файл размером примерно 400 ГБ. Генерируется ежедневно внешней закрытой системой. Это двоичный файл следующего формата: byte [8] byte [4] byte [n] Где n равно значению int32 ...
Я являюсь пользователем apache solr около года. Я использовал solr для простых инструментов поиска, но теперь я хочу использовать solr с данными объемом 5 ТБ. Я предполагаю, что 5 ТБ данных станут 7 ТБ, когда solr проиндексирует их в соответствии с фильтр
Это вопрос собеседования: существует 1 миллиард номеров сотовых телефонов, состоящих из 11 цифр, они хранятся в произвольном порядке в файле, например 12345678910, первая цифра должна быть 1. Просмотрите эти ...
Я использую 64-битный matlab с 32 гб оперативной памяти (просто чтобы вы знали). У меня есть файл (вектор) из 1,3 миллиона чисел (целых). Я хочу сделать другой вектор той же длины, где каждая точка является взвешенным ...
Мне нужно решить задачу коммивояжера, используя генетический алгоритм, который мне придется напишите для домашнего задания. Проблема состоит из 52 городов. Следовательно, пространство поиска 52 !. Мне нужно ...
Я планирую использовать отличный плагин isotope для отображения списка контактов и последующей их фильтрации. У меня проблема в том, что он отлично работает для небольшого набора данных, но я не уверен ...
У меня есть файлы CSV с несколькими отсортированными столбцами. Например, у меня могут быть такие строки: 19980102,,PLXS,10032,Q,A,,,15.12500,15.00000,15.12500,2
19980105,,PLXS,10032,Q,A,,,14.93750,...
Я реализую алгоритм поиска по графу Strong Connected Component (SCC) Kosaraju в Python. Программа отлично работает на небольшом наборе данных, но когда я запускаю ее на очень большом графе (более 800 000...
Я хотел бы чтобы узнать, какое решение лучше всего подходит для хранения большого количества изображений на нескольких серверах, таких как google, facebook. Кажется, что хранение в файловой системе лучше, чем в базе данных, но...
Я работаю над проектом, который будет включать запуск алгоритмов на больших графах. Самые большие два имеют около 300 тыс. и 600 тыс. вершин (я думаю, довольно редко). Я надеюсь найти java-библиотеку, которая сможет...
Мне интересно, существует ли алгоритм, вычисляющий среднее значение и стандартное отклонение несвязанного набора данных. например, я отслеживаю значение измерения, скажем, электрического тока. Я...
Я хотел бы узнать мнение коллег-специалистов относительно лучших в своем классе структур данных, которые будут использоваться для индексирования временных-рядов (также известные как столбцовые-данные, также известные как плоские линейные). Два основных ти
Я пытаюсь создать скрипт Python, который будет принимать адрес в качестве входных данных и выдавать его широту и долготу или широту и долготу в случае множественных совпадений, совсем как Nominatim....
Сейчас я ищу способ обработки больших наборов данных. кажется, что stxxl часто рекомендуется как решение, однако мне нужно узнать о нем больше, прежде чем принимать решение. вопрос в том, что...
Мы разрабатываем и поддерживаем несколько систем, которым необходимо экспортировать отчеты в формате Excel для конечного пользователя. Отчеты собираются из базы данных MySQL с некоторой тривиальной обработкой и ...
Кто-нибудь знает самый быстрый способ получить данные из таблицы Excel (VBA Array) в таблицу на SQL 2008 без с помощью внешней утилиты (т.е. bcp)?
Имейте в виду, что мои наборы данных обычно состоят из 6500-15000 строк, ...
Я изо всех сил пытаюсь установить vowpal wobbit, и он терпит неудачу, когда я запускаю файл make, выбрасывая библиотеку :cd; делать; cd.. g++ -g -o ezexample temp2.cc -L../vowpalwabbit -l vw -l allreduce -l...
У меня есть ~300 текстовых файлов, содержащих данные о трекерах, торрентах и пирах. Каждый файл организован следующим образом :tracker.txt время торрента время однорангового узла время однорангового соединения... время торрент... У меня есть...
Представьте, что у вас есть следующий массив целых чисел :массив (1, 2, 1, 0, 0, 1, 2, 4, 3, 2, [...] ); Целые числа доходят до одного миллиона записей; только вместо того, чтобы быть жестко запрограммированными, они были предварительно -...
У меня есть файл.bat, в который я могу передать параметры. LOAD _TABLE _WRAPPER.BAT Table1 DEV Вкратце, он запускает SQL для загрузки Table1 в среде Dev. Теперь я хочу, чтобы он загружал несколько таблиц за одну ночь....
поэтому в моих приложениях есть контейнеры со 100 миллионами и более элементов. Я ищу контейнер, который ведет себя -по времени -по времени -лучше, чем std ::deque (, не говоря уже о std ::vector )по отношению к...
Я хочу создать среду для искусственного интеллекта планетарных размеров. Он будет имитировать подземную жизнь в очень большом мире. Согласно Википедии, планета Земля имеет площадь поверхности...
Я работаю над проектом, в котором у меня есть большие входные файлы, полученные из численных решений pdes. Формат данных следующий. x \t y \t f (x,y )Для каждого значения y имеем несколько...