Существует ли алгоритм для нахождения энтропии Шеннона для текста?

Я знаю, что энтропия Шеннона для английского языка составляет от 1,0 до 1,5 бит на букву, а некоторые говорят, что от 0,6 до 1,3 бит на букву, но мне было интересно, есть ли способ запустить алгоритм, который просматривает большой объем текста. а затем определить ожидаемое значение коллективного текста, скажем, 0,08 бит на букву коллективного текста?

9
задан Polo Montana 8 April 2012 в 10:04
поделиться