Я ищу научно-исследовательские работы или записи в применении Самого Длинного Общего алгоритма Subsquence к таблицам SQL для получения представления разности данных. Другие предложения о том, как разрешить проблему разности таблицы, также одобрены. Так как проблемой является тот SQL, таблицы имеют эту противную привычку к получению ДОВОЛЬНО БОЛЬШИХ и применяющихся простых алгоритмов, разработанных для обработки текста, может привести к программе, которая никогда не заканчивается...
так, учитывая таблицу Original
:
Key Content
1 This row is unchanged
2 This row is outdated
3 This row is wrong
4 This row is fine as it is
и таблица New
:
Key Content
1 This row was added
2 This row is unchanged
3 This row is right
4 This row is fine as it is
5 This row contains important additions
Я должен узнать Diff
:
+++ 1 This row was added
--- 2 This row is outdated
--- 3 This row is wrong
+++ 3 This row is right
+++ 5 This row contains important additions
Если вы экспортируете свои таблицы в файлы csv, вы можете использовать http://sourceforge.net/projects/csvdiff/
Цитата: csvdiff - это Perl скрипт для сравнения двух csv файлов с возможностью выбора разделителя. возможностью выбора разделителя. Различия будут показаны как: "Столбец XYZ в записи 999" отличается. После этого будет показан фактический и После этого будет показан фактический и ожидаемый результат для этого столбца.