R - преобразовать БОЛЬШУЮ таблицу в матрицу по именам столбцов

Это расширение существующего вопроса: Преобразование таблицы в матрицу по именам столбцов

Я использую окончательный ответ: https:// stackoverflow.com/a/2133898/1287275

Исходная матрица файла CSV содержит около 1,5 млн строк с тремя столбцами... индекс строки, индекс столбца и значение. Все числа являются длинными целыми числами. Базовая матрица представляет собой разреженную матрицу размером около 220 КБ x 220 КБ со средним значением около 7 значений в строке.

Оригинальный read.table работает просто отлично.

  x <- read.table("/users/wallace/Hadoop_Local/reference/DiscoveryData6Mo.csv", header=TRUE);

Моя проблема возникает, когда я выполняю команду reshape.

  reshape(x, idvar="page_id", timevar="reco", direction="wide")

ЦП достигает 100% и остается там навсегда. Машина (mac) имеет больше памяти, чем использует R. Я не понимаю, почему создание разреженной матрицы должно занимать так много времени.

Я использую матричный пакет по умолчанию. Я ничего дополнительно не устанавливал. Я только что скачал R несколько дней назад, поэтому у меня должна быть последняя версия.

Предложения?

Спасибо, Wallace

5
задан Community 23 May 2017 в 12:11
поделиться