Есть ли подходящая библиотека, которую я могу использовать для преобразования PDF в HTML или какой-либо другой формат, который можно легко преобразовать в HTML?
Я искал похожие вопросы, но безуспешно.
Я хочу иметь возможность извлекать текст из PDF-файлов, возможно, изображения. Я не собираюсь вставлять PDF в HTML.