Я бы взглянул на Юнг . Он имеет ряд реализованных алгоритмов кластеризации, хотя я не уверен, что K-средства является одним из них.
Другой вариант может посмотреть ныть , редактор рабочего процесса на основе Eclipse. Это включает в себя ряд кластеризации примитивов, которые вы можете использовать как часть рабочего процесса, включая K-средства.
Apache Mahout реализует множество алгоритмов кластеризации, через Хадуп. Это немного тяжеловато для того, что ты хочешь, но..: http://cwiki.apache.org/MAHOUT/syntheticcontroldata.html
Также вы можете откопать и адаптировать код кластеризации пользователя из класса TreeClusteringRecommender Махаута, который использует кластеризацию в рекомендательных целях.