Как выполнить кластеризацию k-средних в mahout с векторными данными, хранящимися как CSV?

У меня есть файл, содержащий векторы данных, где каждая строка содержит список значений, разделенных запятыми. Мне интересно, как выполнить кластеризацию k-средних для этих данных с помощью mahout. В примере, приведенном в вики, упоминается создание sequenceFiles, но в остальном я не уверен, нужно ли мне выполнять какое-либо преобразование, чтобы получить эти sequenceFiles.

6
задан Dan Q 9 January 2012 в 08:01
поделиться