Как Вы пишете код, который безопасен для UTF-8?

Я думаю, вы смешиваете текст и методы HTML. Посмотрите на этот пример, если вы используете внутренний HTML-код элемента как текст, вы получите декодированные HTML-теги (вторая кнопка). Но если вы используете их как HTML, вы получите представление в формате HTML (первая кнопка).

here is a HTML content.

  

Results here !

Первая кнопка пишет: вот HTML-контент.

Вторая кнопка пишет: вот содержимое & lt; B> HTML & lt; / B>.

Кстати, вы можете увидеть плагин, который я нашел в плагине jQuery - HTML-декодирование и кодирование , который кодирует и декодирует строки HTML.

10
задан Community 13 April 2017 в 12:23
поделиться

13 ответов

Во-первых, сбросьте все предыдущие предпочтения представления папки путем удаления ~/.local/share/gvfs-metadata (источник)

, Затем, открывают Nautilus и выбирают Edit -> Preferences -> Views (tab) -> View new folders using и изменяются на List View:

Nautilus prefs dialogue

124
ответ дан Community 22 October 2019 в 14:47
поделиться

Это похоже на всестороннее краткое руководство по:
http://www.cl.cam.ac.uk/~mgk25/unicode.html

3
ответ дан 3 December 2019 в 22:39
поделиться

Для Gnome 2 следующее должно быть достаточно:

sudo gconftool-2 --direct --config-source xml:readwrite:/etc/gconf/gconf.xml.defaults --type string --set /apps/nautilus/preferences/default_folder_viewer list_view

Другие возможные значения icon_view и compact_view

Для Ubuntu 12.04 и подобного Основанного на единице UI, редактируют /usr/share/glib-2.0/schemas/org.gnome.nautilus.gschema.xml файл: найдите default-folder-viewer ключ и замените <default> значение тега 'list-view'

4
ответ дан arzakon 22 October 2019 в 14:47
поделиться

Другой возможный способ решить это до редактор dconf , см. org.gnome.nautilus.preferences и default-folder-viewer там.

prefs picture

Это означает, что было бы простое короткое выражение для изменения этого, таким образом, можно включать его легко в сценарии конфигурации/установки. Посмотрите больше на dconf.

5
ответ дан Community 22 October 2019 в 14:47
поделиться

Для всех, кому нравится делать, вещи терминалом, изменяющим настройки для наутилуса, могут быть сделаны

gsettings set org.gnome.nautilus.preferences default-folder-viewer 'list-view'

, Если необходимо узнать, какие настройки применяются к наутилусу, можно пойти

gsettings get org.gnome.nautilus.preferences default-folder-viewer

, кредиты на это сообщение переходят в: https://scivision.co/ubuntu-setting-nautilus-default-view-to-detailed-list-view /

24
ответ дан Daniel 22 October 2019 в 14:47
поделиться

Следуя примеру Huge, это было остротой, которую я должен был на Ubuntu 16 изменить от значка до представления списка:

gsettings set org.gnome.nautilus.preferences default-folder-viewer 'list-view'
2
ответ дан user654234 22 October 2019 в 14:47
поделиться

Просто будьте 8-разрядные чистый по большей части. Однако необходимо будет знать, что любой символ неASCII разделяет через несколько байтов, таким образом, необходимо принять во внимание это если повреждение строки или текст усечения для дисплея.

UTF-8 имеет преимущество, которое можно всегда говорить, где Вы находитесь в многобайтовом символе: если бит 7 установлен и кусает 6 сброса (байт является 0x80-0xBF), это - запаздывающий байт, в то время как, если биты 7 и 6 установлены и 5, сбрасывается (0xC0-0xDF), это - ведущий байт с одним запаздывающим байтом; если 7, 6 и 5 установлены, и 4 сбрасывается (0xE0-0xEF), это - ведущий байт с двумя запаздывающими байтами и так далее. Количество последовательного набора битов на уровне старшего значащего бита является общим количеством байтов, составляющих символ. Это:

110x xxxx = двухбайтовый символ
1110 xxxx = трехбайтовый символ
1 111 0xxx = четырехбайтовый символ
и т.д.

Исландский алфавит все содержится в ISO 8859-1 и следовательно Windows 1252. Если это - приложение консольного режима, знают, что консоль использует кодовые страницы IBM, таким образом (в зависимости от системной локали) она могла бы отобразиться в 437, 850, или 861. Windows не имеет никакой собственной поддержки дисплея UTF-8; необходимо преобразовать к UTF-16 и API Unicode использования.

Вызов SetConsoleCP и SetConsoleOutputCP, определение кодовой страницы 1252, помогут с Вашей проблемой, если это будет приложение консольного режима. К сожалению, выбранный шрифт консоли должен быть шрифтом, который поддерживает кодовую страницу, и я не вижу способ установить шрифт. Стандартные растровые шрифты только поддерживают системное значение по умолчанию кодовая страница OEM.

10
ответ дан 3 December 2019 в 22:39
поделиться

Знайте, что полный unicode не помещается в символы на 16 битов; так или используйте 32-разрядные символы, или кодирование переменной ширины (UTF-8 является самым популярным).

1
ответ дан 3 December 2019 в 22:39
поделиться

Исландский язык использует латынь ISO 1, таким образом, восемь битов должны быть достаточно. Нам нужно больше деталей для выяснения то, что происходит.

0
ответ дан 3 December 2019 в 22:39
поделиться

Вы могли бы хотеть проверить icu. У них могли бы быть функции, доступные, который сделает работу со строками UTF-8 легче.

1
ответ дан 3 December 2019 в 22:39
поделиться

UTF-8 был разработан точно с Вашими проблемами в памяти. Одна вещь, относительно которой я был бы осторожен, состоит в том, что ASCII является действительно 7-разрядным кодированием, поэтому если какая-либо часть Вашей инфраструктуры использует 8-й бит для других целей, которые могут быть хитрыми.

1
ответ дан 3 December 2019 в 22:39
поделиться

Можно хотеть использовать широкие символы (wchar_t вместо символа и станд.:: wstring вместо станд.:: строка). Это автоматически не решает 100% Ваших проблем, но является хорошим первым шагом.

Также используйте строковые функции, которые осведомлены о Unicode (обратитесь к документации). Если что-то управляет широкими символами, или представьте его в виде строки, обычно знает, что они широки.

-1
ответ дан 3 December 2019 в 22:39
поделиться

Исландский, как и французский, немецкий и большинство других языков Западной Европы, может поддерживаться с использованием 8-битного набора символов (CP1252 в Windows, ISO 8859-1, также известный как Latin1 в * x) . Это был стандартный подход до изобретения Unicode, и он до сих пор остается довольно распространенным. Как вы говорите, у вас есть ограничение, что вы не можете переписать приложение для использования wchar, и вам это не нужно.

Вы не должны удивляться, что UTF-8 вызывает проблемы; UTF-8 кодирует символы, отличные от ASCII (например, латинские символы с акцентом, шип, eth и т. Д.), Как ДВА БАЙТА каждый.

Единственный общий совет, который можно дать, довольно прост (теоретически): (1) решите, какой набор символов вы собираетесь поддерживать (Unicode, Latin1, CP1252, ...) в вашей системе. (2) если вам предоставляются данные, закодированные другим способом (например, UTF-8), перекодируйте их в свой стандарт (например, CP1252) на границе системы. (3) если вам нужно предоставить данные, закодированные другим способом, ...

0
ответ дан 3 December 2019 в 22:39
поделиться
Другие вопросы по тегам:

Похожие вопросы: