Я использую awk (mac os x) для печати только строк длиной от n символов.
Если я попробую это сделать с текстовым файлом (strings.txt), который будет выглядеть так:
four
foo
bar
föö
bår
fo
ba
fö
bå
И я запустил этот сценарий awk:
awk ' { if( length($0) >= 3 ) print $0 } ' <strings.txt
Результат будет:
four
foo
bar
föö
bår
fö
bå
(Последние две строки не должны были быть напечатаны). Кажется, что слова, содержащие символы умляута (å, ä, ö ...), считаются двумя символами.
(Входной файл сохраняется в формате UTF8.)