Обработка многобайтовых (не ASCII) символов в C

Я пытаюсь создать свою собственную версию wc (фильтр unix), но у меня проблема с символами, отличными от ASCII. Я сделал дамп HEX текстового файла и обнаружил, что эти символы занимают более одного байта. Так что они не подходят для обугливания. Есть ли способ прочитать эти символы из файла и обработать их как одиночные символы (для подсчета символов в файле) в C? Я сделал дамп HEX текстового файла и обнаружил, что эти символы занимают более одного байта. Итак ...

Я пытаюсь создать собственную версию wc (фильтр unix), но у меня проблема с символами, отличными от ASCII. Я сделал HEX-дамп текстового файла и обнаружил, что эти символы занимают более одного байта. Так что они не подходят для обугливания. Есть ли способ прочитать эти символы из файла и обработать их как одиночные символы (для подсчета символов в файле) в C? Я сделал HEX-дамп текстового файла и обнаружил, что эти символы занимают более одного байта. Итак ...

Я пытаюсь создать свою собственную версию wc (фильтр unix), но у меня проблема с символами, отличными от ASCII. Я сделал HEX-дамп текстового файла и обнаружил, что эти символы занимают более одного байта. Так что они не подходят для обугливания. Есть ли способ прочитать эти символы из файла и обработать их как отдельные символы (для подсчета символов в файле) в C? Я немного погуглил и нашел какой-то тип wchar_t, но не было простых примеров того, как использовать его с файлами.

5
задан Salek 16 March 2019 в 02:41
поделиться