] Пакет arules в R использует класс «транзакции». Итак, чтобы использовать функцию [] apriori () [
], мне нужно преобразовать мои существующие данные. У меня есть матрица с 2 столбцами и строками примерно 1,6 мм, и я пытался преобразовать данные следующим образом: [
transaction_data <- as(split(original_data[,"id"], original_data[,"type"]), "transactions")
]
[] где original_data - моя матрица данных. Из-за большого количества данных я использовал самую большую машину AWS Amazon с 64 ГБ оперативной памяти. Через некоторое время я получаю [
] [] [] [], что результирующий вектор превышает лимит длины вектора в 'AnswerType' [
] [
]. Использование памяти машиной все еще было «всего» на уровне 60%. Это ограничение на основе R? Есть ли способ обойти это, кроме использования выборки? При использовании только 1/4 данных преобразование работало нормально. [
] [] Редактировать: Как указывалось, одна из переменных была фактором, а не символом. После изменения преобразование было обработано быстро и правильно. [
]