Кажется, что он не распознает Ó с ударением, поскольку
#!/usr/bin/env perl
use strict;
use warnings;
use 5.14.0;
use utf8;
use feature 'unicode_strings';
" SIMÓN " =~ /^\s+(\p{Upper}+)/u;
print "$1\n";
возвращает в верхнем регистре
SIM
Perl должен иметь возможность использовать данные Unicode, которые уже помечают Ó как верхний регистр.
Из emacs description-char
character code properties: customize what to show
name: LATIN CAPITAL LETTER O WITH ACUTE
old-name: LATIN CAPITAL LETTER O ACUTE
general-category: Lu (Letter, Uppercase)
decomposition: (79 769) ('O' '́')