Как вырезать-вставить из PDF с кодировкой, отличной от ASCII?

У меня есть несколько PDF-файлов, и я пытаюсь вырезать и вставить содержащийся в них текст из Acrobat Reader в HTML-форму. . Кажется, что некоторые из этих файлов используют (я подозреваю) Unicode для кодирования текста, поэтому, когда я пытаюсь вставить в HTML-форму (в firefox), я получаю маленькие прямоугольники с шестнадцатеричными символами в них, а не читаемый текст. Проблема не в том, что PDF-файл не был распознан - когда я пытаюсь сделать это в Acrobat Pro, он говорит, что не может, потому что файл уже содержит отображаемый текст. Есть ли способ с этим справиться? Например, можно ли добавить в форму какой-нибудь javascript, который будет выполнять преобразование?

7
задан Steve 4 February 2012 в 18:12
поделиться