0
ответов

Сортировка гигантских двоичных файлов с помощью C #

У меня большой файл размером примерно 400 ГБ. Генерируется ежедневно внешней закрытой системой. Это двоичный файл следующего формата: byte [8] byte [4] byte [n] Где n равно значению int32 ...
вопрос задан: 22 September 2017 17:44
0
ответов

Может ли Apache Solr обрабатывать большие данные размером в терабайт

Я являюсь пользователем apache solr около года. Я использовал solr для простых инструментов поиска, но теперь я хочу использовать solr с данными объемом 5 ТБ. Я предполагаю, что 5 ТБ данных станут 7 ТБ, когда solr проиндексирует их в соответствии с фильтр
вопрос задан: 22 September 2017 17:44
0
ответов

проверить 1 миллиард номеров сотовых телефонов на наличие дубликатов.

Это вопрос собеседования: существует 1 миллиард номеров сотовых телефонов, состоящих из 11 цифр, они хранятся в произвольном порядке в файле, например 12345678910, первая цифра должна быть 1. Просмотрите эти ...
вопрос задан: 22 September 2017 17:44
0
ответов

Чрезвычайно большое средневзвешенное значение

Я использую 64-битный matlab с 32 гб оперативной памяти (просто чтобы вы знали). У меня есть файл (вектор) из 1,3 миллиона чисел (целых). Я хочу сделать другой вектор той же длины, где каждая точка является взвешенным ...
вопрос задан: 22 September 2017 17:44
0
ответов

Выборочные перестановки [1,2,3,…, N] для большого N

Мне нужно решить задачу коммивояжера, используя генетический алгоритм, который мне придется напишите для домашнего задания. Проблема состоит из 52 городов. Следовательно, пространство поиска 52 !. Мне нужно ...
вопрос задан: 22 September 2017 17:44
0
ответов

как работать с большими наборами данных с помощью изотопа jquery

Я планирую использовать отличный плагин isotope для отображения списка контактов и последующей их фильтрации. У меня проблема в том, что он отлично работает для небольшого набора данных, но я не уверен ...
вопрос задан: 22 September 2017 17:44
0
ответов

разбить большой текстовый файл csv на основе значения столбца

У меня есть файлы CSV с несколькими отсортированными столбцами. Например, у меня могут быть такие строки: 19980102,,PLXS,10032,Q,A,,,15.12500,15.00000,15.12500,2 19980105,,PLXS,10032,Q,A,,,14.93750,...
вопрос задан: 22 September 2017 17:44
0
ответов

Что вызывает ошибку сегментации Python?

Я реализую алгоритм поиска по графу Strong Connected Component (SCC) Kosaraju в Python. Программа отлично работает на небольшом наборе данных, но когда я запускаю ее на очень большом графе (более 800 000...
вопрос задан: 22 September 2017 17:44
0
ответов

Хранить большое количество изображений на нескольких серверах

Я хотел бы чтобы узнать, какое решение лучше всего подходит для хранения большого количества изображений на нескольких серверах, таких как google, facebook. Кажется, что хранение в файловой системе лучше, чем в базе данных, но...
вопрос задан: 22 September 2017 17:44
0
ответов

Библиотека Java для хранения и обработки больших (до 600 тыс. вершин) графов

Я работаю над проектом, который будет включать запуск алгоритмов на больших графах. Самые большие два имеют около 300 тыс. и 600 тыс. вершин (я думаю, довольно редко). Я надеюсь найти java-библиотеку, которая сможет...
вопрос задан: 22 September 2017 17:44
0
ответов

Среднее значение и стандартное отклонение очень большого набора данных

Мне интересно, существует ли алгоритм, вычисляющий среднее значение и стандартное отклонение несвязанного набора данных. например, я отслеживаю значение измерения, скажем, электрического тока. Я...
вопрос задан: 22 September 2017 17:44
0
ответов

Лучшие в своем классе структуры данных индексирования для чрезвычайно больших временных-рядов

Я хотел бы узнать мнение коллег-специалистов относительно лучших в своем классе структур данных, которые будут использоваться для индексирования временных-рядов (также известные как столбцовые-данные, также известные как плоские линейные). Два основных ти
вопрос задан: 22 September 2017 17:44
0
ответов

Какую структуру данных следует использовать для геокодирования?

Я пытаюсь создать скрипт Python, который будет принимать адрес в качестве входных данных и выдавать его широту и долготу или широту и долготу в случае множественных совпадений, совсем как Nominatim....
вопрос задан: 22 September 2017 17:44
0
ответов

Существуют ли тесты для больших контейнеров данных?

Сейчас я ищу способ обработки больших наборов данных. кажется, что stxxl часто рекомендуется как решение, однако мне нужно узнать о нем больше, прежде чем принимать решение. вопрос в том, что...
вопрос задан: 22 September 2017 17:44
0
ответов

Создание больших файлов Excel из данных MySQL с помощью PHP из корпоративных приложений

Мы разрабатываем и поддерживаем несколько систем, которым необходимо экспортировать отчеты в формате Excel для конечного пользователя. Отчеты собираются из базы данных MySQL с некоторой тривиальной обработкой и ...
вопрос задан: 22 September 2017 17:44
0
ответов

Самый быстрый способ переноса данных таблицы Excel в SQL 2008R2

Кто-нибудь знает самый быстрый способ получить данные из таблицы Excel (VBA Array) в таблицу на SQL 2008 без с помощью внешней утилиты (т.е. bcp)? Имейте в виду, что мои наборы данных обычно состоят из 6500-15000 строк, ...
вопрос задан: 22 September 2017 17:44
0
ответов

Ошибки из-за зависимостей vowpal wabbit от библиотеки boost

Я изо всех сил пытаюсь установить vowpal wobbit, и он терпит неудачу, когда я запускаю файл make, выбрасывая библиотеку :cd; делать; cd.. g++ -g -o ezexample temp2.cc -L../vowpalwabbit -l vw -l allreduce -l...
вопрос задан: 22 September 2017 17:44
0
ответов

Как проанализировать ~13 ГБ данных?

У меня есть ~300 текстовых файлов, содержащих данные о трекерах, торрентах и ​​пирах. Каждый файл организован следующим образом :tracker.txt время торрента время однорангового узла время однорангового соединения... время торрент... У меня есть...
вопрос задан: 22 September 2017 17:44
0
ответов

PHP и ребенок с миллионным массивом

Представьте, что у вас есть следующий массив целых чисел :массив (1, 2, 1, 0, 0, 1, 2, 4, 3, 2, [...] ); Целые числа доходят до одного миллиона записей; только вместо того, чтобы быть жестко запрограммированными, они были предварительно -...
вопрос задан: 22 September 2017 17:44
0
ответов

Вызов файла.BAT из другого файла.bat

У меня есть файл.bat, в который я могу передать параметры. LOAD _TABLE _WRAPPER.BAT Table1 DEV Вкратце, он запускает SQL для загрузки Table1 в среде Dev. Теперь я хочу, чтобы он загружал несколько таблиц за одну ночь....
вопрос задан: 22 September 2017 17:44
0
ответов

C++ :замена контейнера для vector/deque для больших размеров

поэтому в моих приложениях есть контейнеры со 100 миллионами и более элементов. Я ищу контейнер, который ведет себя -по времени -по времени -лучше, чем std ::deque (, не говоря уже о std ::vector )по отношению к...
вопрос задан: 22 September 2017 17:44
0
ответов

Сжатие данных без потерь для чрезвычайно больших объемов данных -Планетарный искусственный интеллект

Я хочу создать среду для искусственного интеллекта планетарных размеров. Он будет имитировать подземную жизнь в очень большом мире. Согласно Википедии, планета Земля имеет площадь поверхности...
вопрос задан: 22 September 2017 17:44
0
ответов

Эффективное хранение и чтение больших файлов данных

Я работаю над проектом, в котором у меня есть большие входные файлы, полученные из численных решений pdes. Формат данных следующий. x \t y \t f (x,y )Для каждого значения y имеем несколько...
вопрос задан: 22 September 2017 17:44