htmlentities () делает китайские иероглифы непригодными для использования

у нас есть веб-приложение, в котором мы позволяем пользователям вводить свой собственный HTML-код в текстовой области. Мы сохраняем эти данные в нашей базе данных .

Когда мы загружаем html-данные в текстовую область, мы, конечно, используем htmlentities () перед тем, как бросить html-данные в текстовое поле. В противном случае пользователи могли бы сохранять данные внутри текстовой области, и наше приложение сломалось бы при загрузке в текстовую область. .

это отлично работает, за исключением ввода китайских иероглифов (и, возможно, других языков, таких как арабский, японский).

htmlentities () делает китайский текст непригодным для использования следующим образом: Ã�¨Ã�³Ã�¼Ã� §ï Когда я удаляю htmlentities () перед загрузкой введенного html в текстовую область, китайские иероглифы отображаются нормально, но тогда возникает проблема, связанная с вмешательством HTML в нашу текстовую область, особенно когда пользователь входит внутрь текстовой области.

Я надеюсь, что это имеет смысл.

Кто-нибудь знает, как мы можем безопасно и правильно разрешить использование таких языков, как китайский, японский, ... внутри нашей текстовой области, при этом сохраняя безопасность для загрузки любого html внутри нашей текстовой области?

5
задан Jorre 23 June 2011 в 10:40
поделиться