awk åäö umlaut-chars имеет длину 2

Я использую awk (mac os x) для печати только строк длиной от n символов.

Если я попробую это сделать с текстовым файлом (strings.txt), который будет выглядеть так:

four
foo
bar
föö
bår
fo
ba
fö
bå

И я запустил этот сценарий awk:

awk ' { if( length($0) >= 3 ) print $0 } ' <strings.txt 

Результат будет:

four
foo
bar
föö
bår
fö
bå

(Последние две строки не должны были быть напечатаны). Кажется, что слова, содержащие символы умляута (å, ä, ö ...), считаются двумя символами.

(Входной файл сохраняется в формате UTF8.)

5
задан mklement0 27 March 2015 в 04:18
поделиться