Как действительно “вырезает и вставляет” кодировку символов влияния и что может пойти не так, как надо?

Question

Как действительно “вырезает и вставляет” кодировку символов влияния и что может пойти не так, как надо?

У меня есть документ A в кодировании отображенного в инструменте A и документа B в кодировании B отображенный в инструменте B. Если я вырезал и вставил (часть) B в, какова могла бы быть результирующая кодировка символов? Я понимаю, что это зависит от инструмента A и инструмента B и информации, содержимой в буфере (который, по-видимому, может содержать кодирование?) и операционная система.

Что должны сделать высококачественные инструменты? и на практике сколько из общих инструментов (например, Word, TextPad, различные IDE, и т.д.) делает хорошее задание?

18

character-encoding cut-and-paste

задан peter.murray.rust 18 December 2009 в 18:13

1 ответ

Другие вопросы по тегам:

character-encoding cut-and-paste

Похожие вопросы:

score 20 · Accepted Answer

Прежде всего, внутреннее представление текста в текстовом редакторе не влияет на то, как текст кодируется (сериализуется) при сохранении файла. Итак, документ не «в» кодировке; это последовательность абстрактных символов. Когда документ сохраняется в файл (или передается по сети) , затем он кодируется

. Каждое приложение решает, что оно помещает в буфер обмена. Обычно приложение Windows, которое знает, что делает, помещает в буфер обмена несколько различных представлений. Когда вы вставляете другое приложение, оно будет искать представление, которое лучше всего соответствует его потребностям.

В вашем случае текстовый редактор (который знает, что он делает) поместит Unicode-представление выбранной строки в буфер обмена (где Unicode в Windows, обычно перемещается как UTF-16, но это не важно). Когда вы вставляете другое приложение, оно вставляет эту последовательность символов Unicode в документ в точке выбора.

Вокруг плавает приложение под названием «ClipSpy», которое поможет вам в интерактивном режиме увидеть, о чем я говорю.