Как считать файл pdf программно и преобразовать его в аудио (.mp3 формат)?

Там нет user64.dll по той же причине, что вы только что описали, программа .net может не зависеть от архитектуры процессора, поэтому тот же код должен работать на x86 и x64. Если вы перенесете свою программу на платформу x86, она все равно будет работать без каких-либо изменений.
Я предполагаю, что когда они назвали user32.dll, они не имели в виду эти сценарии.

5
задан Attilah 23 November 2009 в 11:20
поделиться

8 ответов

Желательно, чтобы в качестве входного документа использовался документ PDF с тегами . Это означает, что документ содержит теги для разметки логической структуры документа (обычно документ PDF будет содержать только визуальную информацию).

Этот PDF-файл затем можно преобразовать в формат DAISY , который является стандарт для цифровых говорящих книг, то есть промежуточный формат XML, в котором хранится текст книг вместе с логической структурой и функциями навигации.

Этот XML-формат Daisy может быть либо преобразован в аудиоформат , либо вы можете использовать для прослушивания книги устройство для чтения Daisy, физическое устройство, такое как MP3-плеер.

На веб-сайте Daisy доступна презентация, объясняющая принципы этой инструментальной цепочки:

Доступный PDF-файл для преобразования DAISY / NIMAS

5
ответ дан 18 December 2019 в 12:01
поделиться

Вам понадобится Speech SDK от Microsoft. Прочтите инструкцию здесь

2
ответ дан 18 December 2019 в 12:01
поделиться

Используйте Festival для преобразования текста в речь. Существуют различные API-интерфейсы PDF в текст ...

4
ответ дан 18 December 2019 в 12:01
поделиться

Если ваша единственная задача - прослушать синтезированный текст из PDF-файла, как насчет функции Acrobat «Прочитать вслух» в нижней части меню «Просмотр»?

2
ответ дан 18 December 2019 в 12:01
поделиться

Как указано на других плакатах, сначала вам нужно извлечь текст из файла .pdf. pdf файлы теперь являются открытым форматом, поэтому вы, вероятно, можете найти синтаксический анализатор через Google.

Затем вам нужно извлечь текст, который вы хотите преобразовать в речь, из файла, игнорируя такие вещи, как заголовки рисунков, заголовки страниц, оглавление и т. д.

После того, как вы получили текст, вам нужно преобразовать его в речь. Это, наверное, самая сложная часть.

Некоторое время назад я возился с созданием голосовых файлов для игрового мода, так как я гнилый голосовой актер.

У Cepstral были лучшие конвертеры TTS, которые я мог найти. (Бесплатные имели раздражающую тенденцию вставлять рекламу Cepstral в речь, но я мог вручную отредактировать это для того, что я делал.)

Оказывается, что там '

2
ответ дан 18 December 2019 в 12:01
поделиться

Думаю, это сложно сделать. Сначала вам нужно прочитать текст в этом PDF-файле, а затем использовать некоторый механизм генерации синтетического голоса для создания аудиоконтента. Затем вы должны сохранить его как mp3.

0
ответ дан 18 December 2019 в 12:01
поделиться

В Mac OS X вы можете извлечь текст из PDF-файла и затем передать его по конвейеру «say». Вы должны найти аналогичные синтезаторы в другой ОС.

0
ответ дан 18 December 2019 в 12:01
поделиться

Это не так уж и сложно, при условии, что вы не изобретаете колесо заново, а вместо этого просто повторно используете существующие технологии (например, механизмы преобразования текста в речь, такие как Festival), а также OCR движки для обработки файлов PDF.

Наиболее сложной задачей, вероятно, является работа с различными макетами PDF (столбцы, строки, встроенная графика, сноски, URL-адреса и т.д.), которые могут затруднить процесс распознавания текста.

Однако, в целом (если это не предполагается для обучения), безусловно, проще просто прибегнуть к использованию существующих программных решений:

0
ответ дан 18 December 2019 в 12:01
поделиться
Другие вопросы по тегам:

Похожие вопросы: