] Большие данные преобразуются в «транзакции» из пакета arules [

] [

] Пакет arules в R использует класс «транзакции». Итак, чтобы использовать функцию [] apriori () [], мне нужно преобразовать мои существующие данные. У меня есть матрица с 2 столбцами и строками примерно 1,6 мм, и я пытался преобразовать данные следующим образом: [

] [
transaction_data <- as(split(original_data[,"id"], original_data[,"type"]), "transactions")
] [

] где original_data - моя матрица данных. Из-за большого количества данных я использовал самую большую машину AWS Amazon с 64 ГБ оперативной памяти. Через некоторое время я получаю [

] [
] [

], что результирующий вектор превышает лимит длины вектора в 'AnswerType' [

] [
] [

]. Использование памяти машиной все еще было «всего» на уровне 60%. Это ограничение на основе R? Есть ли способ обойти это, кроме использования выборки? При использовании только 1/4 данных преобразование работало нормально. [

] [

] Редактировать: Как указывалось, одна из переменных была фактором, а не символом. После изменения преобразование было обработано быстро и правильно. [

]
6
задан Marco 7 September 2011 в 14:12
поделиться