Могу ли я использовать алгоритм K-средних для строки?

Я работаю над проектом Python, в котором я изучаю эволюцию структуры РНК (представленную в виде строки, например: "(((...)))", где круглые скобки представляют пар оснований). Дело в том, что у меня идеальная структура и популяция, которая эволюционирует к идеальной структуре. Я реализовал все, но хотел бы добавить функцию, с помощью которой я могу получить «количество сегментов», то есть k наиболее репрезентативных структур в популяции в каждом поколении.

Я думал об использовании алгоритма k-средних, но я я не уверен, как использовать его со строками. Я нашел scipy.cluster.vq , но не знаю, как его использовать в моем случае.

спасибо!

15
задан Doni 9 June 2011 в 13:36
поделиться