Вы можете легко перенастроить LCS в LLCS:
def lcs_length(a, b):
table = [[0] * (len(b) + 1) for _ in xrange(len(a) + 1)]
for i, ca in enumerate(a, 1):
for j, cb in enumerate(b, 1):
table[i][j] = (
table[i - 1][j - 1] + 1 if ca == cb else
max(table[i][j - 1], table[i - 1][j]))
return table[-1][-1]
Демо:
>>> a=[1,2,6,5,4,8]
>>> b=[2,1,6,5,4,4]
>>> lcs_length(a, b)
4
Если вы хотите самую длинную общую подстроку ( другая, но связанная с этим проблема, когда подпоследовательность смежна), use:
def lcsubstring_length(a, b):
table = [[0] * (len(b) + 1) for _ in xrange(len(a) + 1)]
l = 0
for i, ca in enumerate(a, 1):
for j, cb in enumerate(b, 1):
if ca == cb:
table[i][j] = table[i - 1][j - 1] + 1
if table[i][j] > l:
l = table[i][j]
return l
Это очень похоже на подход динамического программирования lcs_length
, но мы отслеживаем максимальную длину, найденную до сих пор (поскольку он больше не гарантирован, что последний элемент в таблице является максимальным).
Это возвращает 3
:
>>> lcsubstring_length(a, b)
3
Вариант разреженной таблицы, который не должен отслеживать все 0
s:
def lcsubstring_length(a, b):
table = {}
l = 0
for i, ca in enumerate(a, 1):
for j, cb in enumerate(b, 1):
if ca == cb:
table[i, j] = table.get((i - 1, j - 1), 0) + 1
if table[i, j] > l:
l = table[i, j]
return l