представьте строку заголовка страницы на любом заданном языке (английский, арабский , японский и т. д.), содержащий несколько слов в кодировке UTF-8. Пример:
$stringRAW = "Blues & μπλουζ Bliss's ブルース Schön";
Теперь это действительно нужно преобразовать во что-то, что является действительной частью URL-адреса этой страницы:
$stringURL = "blues-μπλουζ-bliss-ブルース-schön"
просто проверьте эту ссылку Это работает и на моем сервере!
Q1 . Какие символы разрешены в качестве действительных URL в наши дни? Я помню, что видел целые арабские строки в браузере, и я протестировал его на своем apache 2, и все работало нормально.
Думаю, должно получиться так: $ stringURL = "blues-blows-bliss-black"
Второй квартал. Какие из существующих функций php вы знаете, которые правильно кодируют / конвертируют эти строки UTF-8, чтобы URL-адрес извлекал их из любых недопустимых символов?
Я предполагаю, что по крайней мере:
1. пробелы должны быть преобразованы в тире
-
2. удалить недопустимые символы? какие они? @
и "&"?
3. преобразует все буквы в нижний регистр (или допустимы ли прописные буквы в URL-адресах?)
Спасибо: ваши предложения очень ценны!