Доступ к файлам шрифтов в PDF

В настоящее время мы работаем с рядом издателей над созданием онлайн-книг из их PDF-файлов. Наше устаревшее приложение использует гибкость, поэтому для этого мы конвертируем PDF в файлы SWF с помощью PDF2SWF от SWFTools .

Проблема, с которой мы сталкиваемся, заключается в том, что текст в документе SWF не выделяется нашей гибкой программой чтения, когда пользователь выполняет поиск. После быстрого расследования мы обнаружили, что при извлечении текста нам необходимо встраивать шрифты, которые используются в документе PDF:

http://wiki.swftools.org/wiki/How_do_I_highlight_text_in_the_SWF%3F

pdf2swf -F $YOUR_FONTS_DIR$ -f input.pdf -o output.swf

Как видно из В приведенном выше коде нам нужен путь к каталогу шрифтов, содержащему шрифты, найденные в этом PDF-файле.

Поскольку мы будем конвертировать большое количество PDF-файлов, возможно ли получить доступ к файлам шрифтов напрямую через PDF-файл вместо того, чтобы хранить много шрифтов в нашем приложении?

Дополнительная информация

Наше приложение написано в Java.

В настоящее время мы используем PDFBox и Ghostscript в приложении, поэтому, если какие-либо решения используют эти библиотеки, это будет предпочтительным вариантом, но мы открыты для всех идей.

6
задан My Head Hurts 6 January 2012 в 13:52
поделиться