как извлечь текст из djvu и другого формата электронных книг (возможно в Python) [закрытый]

Ответ довольно очевиден: потому что Вы хотите использовать .NET на Linux.

Это, конечно, вызывает вопрос (который я думаю, действительно, что Вы достигаете): почему Вы хотели бы использовать .NET на Linux (по Java)?

Партии причин:

  • Общий код между Вашим сервером и, скажем, приложением WPF или Winforms;
  • Использование конкретного языка .NET, как F#;
  • функции Language, которые не находятся в Java (закрытия, перегрузка оператора, частичные классы, дженерики во время выполнения, индексаторы, делегаты, LINQ, типы var, и т.д. и т.д. и т.д.);
  • Ваши навыки или те из Вашей команды уже находятся в C#;
  • и т.д.
5
задан leon 8 October 2009 в 15:28
поделиться

2 ответа

python-djvulibre - это набор привязок Python к djvulibre реализация djvu с открытым исходным кодом - я не пробовал, но похоже, что она должна соответствовать вашим потребностям.

3
ответ дан 13 December 2019 в 19:30
поделиться

Конечно, DjVuLibre SDK позволит получить доступ к текстовому слою - если он существует (не все файлы DjVu имеют текстовый слой; многие из них являются чисто растровыми изображениями).

Альтернативное решение может быть, чтобы ваш индекс основывался на технологии IIS. У CamiNova есть бесплатный IFilter, который вы можете использовать для этого.

[ http://dev.caminova.jp/beta/djvu-wic/] [1]

1
ответ дан 13 December 2019 в 19:30
поделиться
Другие вопросы по тегам:

Похожие вопросы: