Как вы сортируете китайские, японские и корейские символы (CJK) в Perl?
Насколько я могу судить, сортировка символов CJK по количеству штрихов, а затем по радикалу, похоже, является способом, которым эти языки отсортированы. Есть также некоторые методы сортировки по звукам, но это кажется менее распространенным.
Я пробовал использовать:
perl -e 'print join(" ", sort qw(工 然 一 人 三 古 二 )), "\n";'
# Prints: 一 三 二 人 古 工 然 which is incorrect
И я ' упорядочены в порядке кодовых точек Unicode ...
Если бы я мог получить базу данных о количестве штрихов на символ, я мог бы легко отсортировать все символы, но, похоже, это не идет с Perl и не инкапсулируется в какой-либо модуль I может найти.
Если вы знаете, как сортировать CJK на других языках, было бы полезно упомянуть об этом в ответе на этот вопрос.