Я почти уверен, что некоторые прототипы должны существовать. Но разрабатывать и производить аппаратные особенности очень дорого. Потребовалось очень много времени, чтобы реализовать MMU или TLB на аппаратном уровне, что довольно легко реализовать.
GC слишком велик, чтобы его можно было эффективно внедрить в аппаратный уровень.
Я решил эту проблему, используя preg_match и регулярные выражения:
$str = "This is a string containing 中文 characters. Some more characters - 中华人民共和国 ";
preg_match(/[\x{4e00}-\x{9fa5}]+.*\-/u, $str, $matches);
Сохраняет ли PHP это как Unicode? Если это так, то в худшем случае вы можете пройти по строке, символ за символом, пока не найдете те, которые находятся в китайском диапазоне.
Проверьте это тоже PHP: Unicode - Руководство