Я пытаюсь создать свою собственную версию wc (фильтр unix), но у меня проблема с символами, отличными от ASCII. Я сделал дамп HEX текстового файла и обнаружил, что эти символы занимают более одного байта. Так что они не подходят для обугливания. Есть ли способ прочитать эти символы из файла и обработать их как одиночные символы (для подсчета символов в файле) в C? Я сделал дамп HEX текстового файла и обнаружил, что эти символы занимают более одного байта. Итак ...
Я пытаюсь создать собственную версию wc (фильтр unix), но у меня проблема с символами, отличными от ASCII. Я сделал HEX-дамп текстового файла и обнаружил, что эти символы занимают более одного байта. Так что они не подходят для обугливания. Есть ли способ прочитать эти символы из файла и обработать их как одиночные символы (для подсчета символов в файле) в C? Я сделал HEX-дамп текстового файла и обнаружил, что эти символы занимают более одного байта. Итак ...
Я пытаюсь создать свою собственную версию wc (фильтр unix), но у меня проблема с символами, отличными от ASCII. Я сделал HEX-дамп текстового файла и обнаружил, что эти символы занимают более одного байта. Так что они не подходят для обугливания. Есть ли способ прочитать эти символы из файла и обработать их как отдельные символы (для подсчета символов в файле) в C? Я немного погуглил и нашел какой-то тип wchar_t, но не было простых примеров того, как использовать его с файлами.