Я должен работать с большими файлами и должен найти различия между два. И мне не нужны различные биты, но количество различий.
Для нахождения количества различных строк, я придумываю
diff --suppress-common-lines --speed-large-files -y File1 File2 | wc -l
И это работает, но является там лучшим способом сделать это?
И как считать точное количество различий (со стандартными инструментами как удар, разность, awk, sed некоторая старая версия жемчуга)?
diff -U 0 file1 file2 | grep -v ^@ | wc -l
Это минус 2 для двух имен файлов в верхней части diff
листинга. Унифицированный формат, вероятно, немного быстрее, чем формат "бок о бок".
При использовании Linux / Unix, как насчет comm -1 file1 file2
для печати строк в file1, которых нет в file2, comm -1 file1 file2 | wc -l
, чтобы их подсчитать, и аналогично для comm -2 ...
?