В настоящее время мы работаем с рядом издателей над созданием онлайн-книг из их PDF-файлов. Наше устаревшее приложение использует гибкость, поэтому для этого мы конвертируем PDF в файлы SWF с помощью PDF2SWF от SWFTools .
Проблема, с которой мы сталкиваемся, заключается в том, что текст в документе SWF не выделяется нашей гибкой программой чтения, когда пользователь выполняет поиск. После быстрого расследования мы обнаружили, что при извлечении текста нам необходимо встраивать шрифты, которые используются в документе PDF:
http://wiki.swftools.org/wiki/How_do_I_highlight_text_in_the_SWF%3F
pdf2swf -F $YOUR_FONTS_DIR$ -f input.pdf -o output.swf
Как видно из В приведенном выше коде нам нужен путь к каталогу шрифтов, содержащему шрифты, найденные в этом PDF-файле.
Поскольку мы будем конвертировать большое количество PDF-файлов, возможно ли получить доступ к файлам шрифтов напрямую через PDF-файл вместо того, чтобы хранить много шрифтов в нашем приложении?
Дополнительная информация
Наше приложение написано в Java.
В настоящее время мы используем PDFBox и Ghostscript в приложении, поэтому, если какие-либо решения используют эти библиотеки, это будет предпочтительным вариантом, но мы открыты для всех идей.