Я хочу использовать str_word_count ()
в строке UTF-8.
Это безопасно в PHP? Мне кажется, что так и должно быть (особенно учитывая, что нет mb_str_word_count ()
).
Но на php.net есть много людей, которые мутят воду, представляя свои собственные «многобайтовые» версии функции .
Думаю, я хочу знать ...
Учитывая, что str_word_count
просто считает все последовательности символов, разделенные ""
(пробел), это должно быть безопасно для многобайтовые строки, даже если они не обязательно знают последовательности символов, верно?
Есть ли в UTF-8 эквивалентные «пробельные» символы, которые не являются ASCII ""
(пробел)? #
. Думаю, в этом и может заключаться проблема.