У меня есть текстовый файл, созданный с помощью программы распознавания текста, размером около одного мегабайта. Некоторые необычные символы появляются по всему документу, и большинство из них являются ошибками распознавания.
Я хотел бы найти все символы, используемые в документе, чтобы легко обнаруживать ошибки (например, команда UNIQ
, но для символов, а не для строк).
Я использую Ubuntu. Какую команду Unix я должен использовать для отображения всех символов, используемых в текстовом файле?