посимвольные значения достоверности с использованием tesseract 3.01

я выполнил следующий код для генерации посимвольных значений достоверности:

int main(int argc, char **argv) {

    const char *lang="eng";
    const PIX   *pixs;
     if ((pixs = pixRead(argv[1])) == NULL) {
       cout <<"Unsupported image type"<GetUTF8Text(RIL_SYMBOL);
            if(symbol != 0)
            {
                float conf = ri->Confidence(RIL_SYMBOL);
                cout<<"\nnext symbol: "<< symbol << " confidence: " << conf <<"\n" <Next(RIL_SYMBOL)));
    }
    return 0;
}

ссылка на изображение

вывод, полученный для приведенного выше изображения было:

следующий символ: N достоверность: 72,3563 следующий символ: B достоверность: 72,3563

следующий символ: E достоверность: 69,9937 следующий символ: T достоверность: 69,9937
следующий символ: R достоверность: 69,9937 следующий символ: A достоверность: 69,9937
следующий символ: достоверность N: 69,9937 следующий символ: достоверность G: 69,9937
следующий символ: - достоверность: 69,9937 следующий символ: I достоверность: 69,9937

Как видно, значения достоверности для символов, принадлежащих одному и тому же слову, одинаковы. Это ожидаемый результат? Разве значения достоверности не должны быть разными для каждого символа? Я попытался выполнить код для слова, в котором каждый символ был в другом стиле шрифта... и все же значение достоверности было одинаковым для символов, принадлежащих к одному и тому же слову.

7
задан sashoalm 4 April 2013 в 16:19
поделиться