Преобразование PDF в осуществимый текст с помощью [закрытого] C#

Я думал бы, что некоторый datbases может импортировать данные из CSV (запятая разделила значения), файлы, которые можно экспортировать из exel. Или по крайней мере это довольно просто в использовании csv синтаксический анализатор (найдите один для Вашего языка, не пытайтесь создать тот сами - это более твердо, чем это смотрит) импортировать его к базе данных.

я не знаком с SQL MS, но меня не удивило бы, если это действительно поддерживает его непосредственно.

В любом случае я думаю, что requrement должен быть то, что структура в листе Exel и таблице базы данных подобна.

5
задан Bobrovsky 8 September 2011 в 17:54
поделиться

3 ответа

Вы пробовали PDFKit.NET ? У него есть разумная документация и несколько хороших примеров. Он разработан для серверной среды, поэтому стоит немного дороже.

EDIT Вот библиотека с открытым исходным кодом на SourceForge под названием iTextSharp . Это бесплатно для проектов с открытым исходным кодом. Не использовал, но выглядит многообещающе. Вот учебное пособие для него с множеством примеров кода.

3
ответ дан 14 December 2019 в 19:17
поделиться

Здесь есть несколько способов - многое из них будет зависеть от того, хотите ли вы сохранить форматирование (т.е. абзацы и другие элементы макета) исходного PDF-файла.

Если вы рассматриваете коммерческие решения, мы предлагаем два продукта, которые могут удовлетворить ваши требования. Одним из них является EasyPDF SDK, который имеет однократные вызовы ExtractText () и ExtractText2 (), которые извлекают текст из ваших PDF-файлов в виде обычного текста.

Обратите внимание, что вывод этих вызовов довольно упрощен, и вы потеряете большую часть исходного макета. элементы. Они хороши для простого извлечения текста, но могут быть не очень хороши, если ваш PDF-файл содержит табличные данные.

Если вы имеете дело с таблицами, более хорошей альтернативой может быть извлечение его как форматированного текста. У нас есть инструмент EasyConverter SDK, предназначенный для бизнес-документов, который делает это с помощью единственного вызова функции.

С EasyConverter SDK макет вашего исходного PDF-файла будет сохранен.

Оба поддерживают C #, так что не стесняйтесь проверить ознакомьтесь с ознакомительными версиями на www.pdfonline.com, если вам интересно. Я работаю на поставщика, поэтому воспринимаю это предложение как своего рода мать, любящую своего собственного ребенка :-) Я долго просматривал stackoverflow.com в поисках фрагментов кода, но только недавно начал публиковать, поэтому, если у вас есть любые вопросы по любому из API просто дайте мне знать, и я могу помочь. Ура!

Я работаю на поставщика, поэтому воспринимаю это предложение как своего рода мать, любящую своего собственного ребенка :-) Я долго просматривал stackoverflow.com в поисках фрагментов кода, но только недавно начал публиковать, поэтому, если у вас есть любые вопросы по любому из API просто дайте мне знать, и я могу помочь. Ура!

Я работаю на поставщика, поэтому воспринимаю это предложение как своего рода мать, любящую своего собственного ребенка :-) Я долго просматривал stackoverflow.com в поисках фрагментов кода, но только недавно начал публиковать, поэтому, если у вас есть любые вопросы по любому из API просто дайте мне знать, и я могу помочь. Ура!

1
ответ дан 14 December 2019 в 19:17
поделиться

в работе мы использовали программу для преобразования изображений в снежный покров. очевидно, он также поддерживает извлечение текста . однако это не бесплатно.

0
ответ дан 14 December 2019 в 19:17
поделиться
Другие вопросы по тегам:

Похожие вопросы: