Как вы сортируете символы CJK (азиатские) в Perl или на любом другом языке программирования?

Как вы сортируете китайские, японские и корейские символы (CJK) в Perl?

Насколько я могу судить, сортировка символов CJK по количеству штрихов, а затем по радикалу, похоже, является способом, которым эти языки отсортированы. Есть также некоторые методы сортировки по звукам, но это кажется менее распространенным.

Я пробовал использовать:

perl -e 'print join(" ", sort qw(工 然 一 人 三 古 二 )), "\n";'
# Prints: 一 三 二 人 古 工 然 which is incorrect

И я ' упорядочены в порядке кодовых точек Unicode ...

Если бы я мог получить базу данных о количестве штрихов на символ, я мог бы легко отсортировать все символы, но, похоже, это не идет с Perl и не инкапсулируется в какой-либо модуль I может найти.

Если вы знаете, как сортировать CJK на других языках, было бы полезно упомянуть об этом в ответе на этот вопрос.

10
задан hippietrail 3 October 2012 в 12:39
поделиться