В PHP, что самый изящный путь состоит в том, чтобы получить полный список (массив строк) всех пробельных символов Unicode, закодированных в utf8?
Мне нужно это для генерации данных тестирования.
Это письмо содержит список всех пробельных символов Юникода, закодированных в UTF-8, UTF-16 и HTML.
edit
Originally answered Feb 9 '10 (!). Действительно, ребята, если информация устарела, вы можете добавить свой собственный ответ, а не жаловаться. Просто ищите в гугле URL, указанный в моем ответе, и заработайте некоторый репортаж:
Почта была заархивирована здесь (заняло у меня секунды), а пробельная таблица даже упоминается во введении
static $whitespace = array(
"SPACE" => "\x20",
"NO-BREAK SPACE" => "\xc2\xa0",
"OGHAM SPACE MARK" => "\xe1\x9a\x80",
"EN QUAD" => "\xe2\x80\x80",
"EM QUAD" => "\xe2\x80\x81",
"EN SPACE" => "\xe2\x80\x82",
"EM SPACE" => "\xe2\x80\x83",
"THREE-PER-EM SPACE" => "\xe2\x80\x84",
"FOUR-PER-EM SPACE" => "\xe2\x80\x85",
"SIX-PER-EM SPACE" => "\xe2\x80\x86",
"FIGURE SPACE" => "\xe2\x80\x87",
"PUNCTUATION SPACE" => "\xe2\x80\x88",
"THIN SPACE" => "\xe2\x80\x89",
"HAIR SPACE" => "\xe2\x80\x8a",
"ZERO WIDTH SPACE" => "\xe2\x80\x8b",
"NARROW NO-BREAK SPACE" => "\xe2\x80\xaf",
"MEDIUM MATHEMATICAL SPACE" => "\xe2\x81\x9f",
"IDEOGRAPHIC SPACE" => "\xe3\x80\x80",
);