У меня есть файл, содержащий векторы данных, где каждая строка содержит список значений, разделенных запятыми. Мне интересно, как выполнить кластеризацию k-средних для этих данных с помощью mahout. В примере, приведенном в вики, упоминается создание sequenceFiles, но в остальном я не уверен, нужно ли мне выполнять какое-либо преобразование, чтобы получить эти sequenceFiles.