Основанная на SQL разность данных: самая длинная общая подпоследовательность

Я ищу научно-исследовательские работы или записи в применении Самого Длинного Общего алгоритма Subsquence к таблицам SQL для получения представления разности данных. Другие предложения о том, как разрешить проблему разности таблицы, также одобрены. Так как проблемой является тот SQL, таблицы имеют эту противную привычку к получению ДОВОЛЬНО БОЛЬШИХ и применяющихся простых алгоритмов, разработанных для обработки текста, может привести к программе, которая никогда не заканчивается...

так, учитывая таблицу Original:

Key  Content
1    This row is unchanged
2    This row is outdated
3    This row is wrong
4    This row is fine as it is

и таблица New:

Key Content
1   This row was added
2   This row is unchanged
3   This row is right
4   This row is fine as it is
5   This row contains important additions

Я должен узнать Diff:

+++ 1 This row was added
--- 2 This row is outdated
--- 3 This row is wrong
+++ 3 This row is right
+++ 5 This row contains important additions

12
задан Remus Rusanu 17 July 2010 в 00:28
поделиться

1 ответ

Если вы экспортируете свои таблицы в файлы csv, вы можете использовать http://sourceforge.net/projects/csvdiff/

Цитата: csvdiff - это Perl скрипт для сравнения двух csv файлов с возможностью выбора разделителя. возможностью выбора разделителя. Различия будут показаны как: "Столбец XYZ в записи 999" отличается. После этого будет показан фактический и После этого будет показан фактический и ожидаемый результат для этого столбца.

1
ответ дан 3 December 2019 в 00:08
поделиться
Другие вопросы по тегам:

Похожие вопросы: