Как собрать статистику использования символов в текстовом файле с помощью команд Unix?

Question

Как собрать статистику использования символов в текстовом файле с помощью команд Unix?

У меня есть текстовый файл, созданный с помощью программы распознавания текста, размером около одного мегабайта. Некоторые необычные символы появляются по всему документу, и большинство из них являются ошибками распознавания.

Я хотел бы найти все символы, используемые в документе, чтобы легко обнаруживать ошибки (например, команда UNIQ , но для символов, а не для строк).

Я использую Ubuntu. Какую команду Unix я должен использовать для отображения всех символов, используемых в текстовом файле?

6

unix command-line text statistics ocr

задан Hali 13 November 2010 в 18:45

0 ответов

Другие вопросы по тегам:

unix command-line text statistics ocr

Как собрать статистику использования символов в текстовом файле с помощью команд Unix?

0 ответов

Похожие вопросы: