У меня есть документ A в кодировании отображенного в инструменте A и документа B в кодировании B отображенный в инструменте B. Если я вырезал и вставил (часть) B в, какова могла бы быть результирующая кодировка символов? Я понимаю, что это зависит от инструмента A и инструмента B и информации, содержимой в буфере (который, по-видимому, может содержать кодирование?) и операционная система.
Что должны сделать высококачественные инструменты? и на практике сколько из общих инструментов (например, Word, TextPad, различные IDE, и т.д.) делает хорошее задание?
Прежде всего, внутреннее представление текста в текстовом редакторе не влияет на то, как текст кодируется (сериализуется) при сохранении файла. Итак, документ не «в» кодировке; это последовательность абстрактных символов. Когда документ сохраняется в файл (или передается по сети) , затем он кодируется
. Каждое приложение решает, что оно помещает в буфер обмена. Обычно приложение Windows, которое знает, что делает, помещает в буфер обмена несколько различных представлений. Когда вы вставляете другое приложение, оно будет искать представление, которое лучше всего соответствует его потребностям.
В вашем случае текстовый редактор (который знает, что он делает) поместит Unicode-представление выбранной строки в буфер обмена (где Unicode в Windows, обычно перемещается как UTF-16, но это не важно). Когда вы вставляете другое приложение, оно вставляет эту последовательность символов Unicode в документ в точке выбора.
Вокруг плавает приложение под названием «ClipSpy», которое поможет вам в интерактивном режиме увидеть, о чем я говорю.