Безопасен ли многобайтовый PHP str_word_count ()?

Я хочу использовать str_word_count () в строке UTF-8.

Это безопасно в PHP? Мне кажется, что так и должно быть (особенно учитывая, что нет mb_str_word_count () ).

Но на php.net есть много людей, которые мутят воду, представляя свои собственные «многобайтовые» версии функции .

Думаю, я хочу знать ...

  1. Учитывая, что str_word_count просто считает все последовательности символов, разделенные "" (пробел), это должно быть безопасно для многобайтовые строки, даже если они не обязательно знают последовательности символов, верно?

  2. Есть ли в UTF-8 эквивалентные «пробельные» символы, которые не являются ASCII "" (пробел)? #

. Думаю, в этом и может заключаться проблема.

10
задан hakre 10 October 2013 в 06:54
поделиться