Как к разницам при подсчете между двумя файлами на Linux?

Я должен работать с большими файлами и должен найти различия между два. И мне не нужны различные биты, но количество различий.

Для нахождения количества различных строк, я придумываю

diff --suppress-common-lines --speed-large-files -y File1 File2 | wc -l

И это работает, но является там лучшим способом сделать это?

И как считать точное количество различий (со стандартными инструментами как удар, разность, awk, sed некоторая старая версия жемчуга)?

48
задан animuson 4 January 2013 в 07:21
поделиться

2 ответа

diff -U 0 file1 file2 | grep -v ^@ | wc -l

Это минус 2 для двух имен файлов в верхней части diff листинга. Унифицированный формат, вероятно, немного быстрее, чем формат "бок о бок".

43
ответ дан 26 November 2019 в 18:43
поделиться

При использовании Linux / Unix, как насчет comm -1 file1 file2 для печати строк в file1, которых нет в file2, comm -1 file1 file2 | wc -l , чтобы их подсчитать, и аналогично для comm -2 ... ?

5
ответ дан 26 November 2019 в 18:43
поделиться
Другие вопросы по тегам:

Похожие вопросы: