Как правильно использовать параметр компилятора charset -finput -в g++, чтобы скомпилировать исходный файл, отличный от -UTF -8?

Question

Как правильно использовать параметр компилятора charset -finput -в g++, чтобы скомпилировать исходный файл, отличный от -UTF -8?

Я пытаюсь скомпилировать исходный файл UTF -16BE C++ в g++ с параметром компилятора -finput -charset, но всегда получаю кучу ошибок. Более подробная информация приведена ниже.

Моя среда (в CentOS Linux):

г++ :4.1.2
iconv :2,5
Язык Linux (в Терминале ):LANG="en _US.UTF -8"

Мой образец исходного файла (, хранящийся в кодировке UTF -16BE ):

// main.cpp:

#include <iostream>

int main()
{
    std::cout << "Hello, UTF-16" << std::endl;
    return 0;
}

. Мои шаги:

Я прочитал руководство по g++ о опции кодировки -finput -. В руководстве по g++ сказано:

-finput-charset=charset Set the input character set, used for translation from the character set of the input file to the source character set used by GCC. If the locale does not specify, or GCC cannot get this information from the locale, the default is UTF-8. This can be overridden by either the locale or this command line option. Currently the command line option takes precedence if there’s a conflict. charset can be any encoding supported by the system’s "iconv" library routine.

Таким образом, я ввел команду следующим образом:

g++ -finput-charset=UTF-16BE main.cpp

и я получил эти ошибки:

In file included from main.cpp:1:

/usr/lib/gcc/i386-redhat-linux/4.1.2/../../../../include/c++/4.1.2/iostream:1: error: stray ‘\342’ in program

/usr/lib/gcc/i386-redhat-linux/4.1.2/../../../../include/c++/4.1.2/iostream:1: error: stray ‘\274’ in program

...(repeatedly, A LOT, around 4000+)...

/usr/lib/gcc/i386-redhat-linux/4.1.2/../../../../include/c++/4.1.2/iostream:1: error: stray ‘\257’ in program

main.cpp: In function ‘int main()’:

main.cpp:5: error: ‘cout’ is not a member of ‘std’

main.cpp:5: error: ‘endl’ is not a member of ‘std’

Текст руководства предполагает, что набор символов может быть любой кодировкой, поддерживаемой подпрограммой iconv, поэтому я предположил, что ошибки компиляции могут быть вызваны моей библиотекой iconv. Затем я протестировал iconv:

iconv --from-code=UTF-16BE --to-code=UTF-8 --output=main_utf8.cpp main.cpp

Файл «main _utf8.cpp» создается, как и ожидалось. Затем я попытался его скомпилировать:

g++ -finput-charset=UTF-8 main_utf8.cpp

Обратите внимание, что я явно указал входную кодировку -, чтобы убедиться, что я сделал что-то не так, но на этот раз «a.out» был сгенерирован без каких-либо ошибок. Когда я запустил его, он мог выдать правильный вывод.

Наконец...

Я не мог понять, где я ошибся. Я искал в Интернете несколько примеров для этой опции компилятора, но не смог.

Пожалуйста, порекомендуйте! Спасибо!

Дальнейшие правки:

Спасибо ребята! Ваши ответы быстрые! Некоторые обновления:

Когда я сказал «UTF -16», я имел в виду «UTF -16 + BOM». На самом деле я использовал UTF -16BE. Я обновил текст выше.
В некоторых ответах говорится, что ошибки вызваны файлами заголовков, отличными от -UTF -16. Вот что я думаю, если это так :Мы всегда будем включать некоторые стандартные заголовочные файлы при написании проекта C/C++, верно? Например, stdio.h или iostream. Если компилятор G++ имеет дело только с кодировкой исходных файлов, созданных нами, но никогда с исходными файлами в стандартной библиотеке, то для чего существует эта опция -finput -charset??

Окончательное редактирование:

Наконец, мое решение выглядит так:

7

character-encoding gcc c++ g++

задан yaobin 26 June 2012 в 12:33

0 ответов

Другие вопросы по тегам:

character-encoding gcc c++ g++

Как правильно использовать параметр компилятора charset -finput -в g++, чтобы скомпилировать исходный файл, отличный от -UTF -8?

Моя среда (в CentOS Linux):

Мой образец исходного файла (, хранящийся в кодировке UTF -16BE ):

. Мои шаги:

Наконец...

Дальнейшие правки:

Окончательное редактирование:

0 ответов

Похожие вопросы: