Алгоритм измерения сходства между двумя последовательностями строк

Как я могу измерить процент сходства между двумя последовательностями строк?

У меня есть два текстовых файла и в файлах там последовательности записаны так

Первый файл:

AAA BBB DDD CCC GGG MMM AAA MMM

Второй файл:

BBB DDD CCC MMM AAA MMM

Как измерить сходство между этими двумя файлами с точки зрения порядка строк?

Например, в приведенном выше примере оба файла имеют сходство из-за того, что порядок строк одинаков, однако некоторые строки отсутствуют в файле-2. Какой алгоритм лучше всего подходит для решения этой проблемы, чтобы я мог измерить, насколько похож порядок строк, а не частота строк в двух?

7
задан Jason Sturges 2 June 2012 в 05:54
поделиться