12
ответов

InputStream возвращает NullPointer: java.lang.NullPointerException в org.apache.pdfbox.text.PDFTextStripper. & Lt; clinit & gt; (PDFTextStripper.java:1825) [дубликат]

im пытается индексировать pdf-файлы, используя исходную версию pdfbox 2.0.7 и lucene 6.6.0. im получаю следующие ошибки. Исключение в потоке "main" java.lang.ExceptionInInitializerError at org.apache ....
вопрос задан: 26 May 2016 16:15
7
ответов

Извлечение только изображений из файла PDF в java с помощью Apache Tika или PDFBox? [Дубликат]

Я ищу способ извлечь только изображения из PDF-файлов, используя apache tika или pdfbox, но изображение не должно быть размытым. Пожалуйста, помогите, я новичок в pdfbox и apache tika. Но покажи мне ...
вопрос задан: 2 January 2012 23:30
4
ответа

Парсинг файлов PDF (особенно с таблицами) с PDFBox

Я должен проанализировать файл PDF, который содержит табличные данные. Я использую PDFBox для извлечения текста файла для парсинга результата (Строка) позже. Проблема состоит в том, что извлечение текста не работает, как я ожидал...
вопрос задан: 26 April 2017 18:57
3
ответа

Текст Copy+pasting от PDF приводит к мусору

Я пишу Магистерскую диссертацию - система обработки естественного языка. У меня есть один компонент - экстрактор. Это извлекает простой текст из файлов PDF. Существует несколько файлов PDF, которые не могут быть извлечены правильно. Экстрактор (...
вопрос задан: 13 April 2015 16:51
3
ответа

создать PDF-файл одной страницы из нескольких PDF-файлов, используя PDFBOX [дубликат]

У меня есть несколько PDF-файлов разных размеров, и каждый PDF имеет только одну страницу. Я хочу разместить PDF-файлы на одной странице с помощью PDFBOX. Как я могу разместить их в определенной точке? Я нашел способы слияния PDF-файлов ...
вопрос задан: 8 October 2014 13:09
2
ответа

Нет глифа для U + 000A в шрифте UbuntuCondensed-Regular в PDFBox 2.0.8 [duplicate]

См. Код, для которого я получаю эту проблему. Моя основная проблема заключается в том, что после установки шрифта я получаю сообщение об ошибке в contentStream.showText (), поэтому кто-нибудь может помочь мне установить шрифт для PDFBox ...
вопрос задан: 1 January 2016 08:38
2
ответа

Создайте внешнюю ссылку с PDFBox [duplicate]

В настоящее время я создаю pdf-файлы с java-библиотекой PDFBox. Я хочу создать текстовую ссылку, которая открывает другой PDF при нажатии. (Я знаю, как создать текстовую ссылку, но не как связать ее с другим ...
вопрос задан: 20 March 2014 11:50
1
ответ

PDFBox с Maven - java.lang.NoClassDefFoundError

При установке PDFBox с Maven библиотеки помещаются в каталог ~ / .m2 / repository. Моя программа прекрасно работает с пакетом mvn. Когда я пытаюсь запустить его с помощью java -cp target / java-project-1.0 -...
вопрос задан: 25 March 2019 00:32
1
ответ

PDFBox не поддерживает несколько языков

Я пытаюсь создать отчет в формате PDF, состоящий из предложений на нескольких языках. Для этого я использую шрифты Google NOTO, но шрифты Google CJK не поддерживают некоторые латинские специальные символы из-за ...
вопрос задан: 15 February 2019 19:50
1
ответ

PDFBOX - заголовок на всех страницах с помощью easytable

Я использую pdfbox и easytable https://github.com/vandeseer/easytable для создания динамических страниц, которые прекрасно работают. Но я хочу, чтобы заголовок был добавлен на всех страницах. Я сталкивался / пробовал ниже вещей. 1) ...
вопрос задан: 17 January 2019 11:26
1
ответ

Невозможно добавить значок в нужные координаты в PDF с помощью ApachePdfBox [дубликат]

Я использую ApachePdfBox для обработки PDF. Я пытаюсь нарисовать значок на изображении PDF, но он всегда заканчивается помещением значка в левом нижнем углу изображения PDF. Я не могу это понять ...
вопрос задан: 13 January 2015 11:13
1
ответ

Как поставить \ n в строку в plist [дубликат]

Возможный дубликат: NSString: переход на новую строку в plist У меня есть список со строкой, и я хочу получить разрывы строк. Ввод \ n \ n не работает. Есть ли другой способ сделать это? Спасибо
вопрос задан: 4 October 2012 11:33
1
ответ

извлечь изображения из pdf с помощью pdfbox

Я пытаюсь извлекать изображения из pdf с помощью pdfbox. Пример pdf здесь Но я получаю только пустые изображения. Код, который я пытаюсь: - public static void main (String [] args) {PDFImageExtract obj = ...
вопрос задан: 2 January 2012 21:30
1
ответ

Невозможно добавить изображение в PDF-файл с помощью PDFBox

Я пишу приложение Java, которое создает PDF-файл с нуля с помощью библиотеки pdfbox. Мне нужно разместить изображение в формате jpg на одной из страниц. Я использую этот код: PDDocument document = new PDDocument (); PDPage ...
вопрос задан: 22 December 2011 09:09
0
ответов

pdfbox перенос текста

Я использую PDFBox со следующим кодом: doc = new PDDocument (); страница = новый PDPage (); doc.addPage (страницы); PDFont font = PDType1Font.COURIER; pdftitle = новый PDPageContentStream (документ, страница); pdftitle ....
вопрос задан: 18 April 2019 18:42
0
ответов

Нужен арабский шрифт для Linux - PDFBox Java

Я использую шрифт Arial в генерации PDF с использованием API PDFBox в Java. Я могу сгенерировать его на Windows, но та же сборка не работает на Linux из-за отсутствия Arial на Linux Какой шрифт ...
вопрос задан: 14 April 2019 09:10
0
ответов

Сглаживание полей PDF удаляет форматирование

Я пытаюсь сгладить поля формы (PDAcroForm.flatten ()) в формате PDF, который содержит форматированный текст. При этом форматирование (жирный, курсив, цвет, размер) теряется. Это больше не съедобно, но ...
вопрос задан: 29 March 2019 12:21
0
ответов

OpenHTMLToPDF: встроить пользовательский шрифт в PDF, созданный из HTML

Я создаю PDF из HTML с помощью Jsoup и OpenHTMLToPDF. Я должен использовать другой шрифт в моем PDF, чтобы покрыть нелатинские глифы (см. Здесь). Как правильно вставить мой шрифт? Упрощенная программа ...
вопрос задан: 27 March 2019 10:08
0
ответов

обработка счетов с помощью таблицы в верхней части pdfbox

Pdfbox очень хорош, но мне интересно, используют ли люди что-то поверх pdfbox для генерации отчетов & amp; фактура с манипулированием в основном таблицей? Что-то вроде https://github.com/dhorions/boxable Любой ...
вопрос задан: 14 March 2019 13:08
0
ответов

PDFBox пунктиром с градиентом

Я уже могу добавить строку с помощью contentStream с помощью методов: setLineWidth (h) - установить толщину линии setLineDashPattern (pattern, period) - шаблон создать необходимое пространство и точки, например, новый float [] {0.075,2} ...
вопрос задан: 7 March 2019 10:18
0
ответов

Apache PDF box - Читать PDF с шрифтом & ldquo; Monotype Sans Duospace WT & rdquo;

Я читаю файл PDF с помощью Apache PDF Box, используя следующий код: PDDocument doc = PDDocument.load (file); PDDocumentCatalog catalog = doc.getDocumentCatalog (); PDPage page = (PDPage) catalog.getPages () ....
вопрос задан: 1 March 2019 07:52
0
ответов

сопоставление юникода для шрифтов, недоступных в pdfbox2.0.13

не удалось найти сопоставление юникода для LHNDPB + TheSans-B4SemiLight, Ubuntu-Identity-H и некоторых других шрифтов Я использую версию pdfBox2.0.13. Пожалуйста, помогите мне найти решение, чтобы получить текст из PDF с ...
вопрос задан: 18 January 2019 03:43
0
ответов

Как точно разместить изображение внутри существующей страницы PDF с помощью PDFBox?

Я могу вставить изображение в существующий документ PDF, но проблема в том, что изображение помещается внизу страницы Страница становится белой, и на ней отображается только что добавленный текст. Я ...
вопрос задан: 16 July 2018 08:35
0
ответов

Как вставить перевод строки с помощью PDFBox drawString

Мне нужно создать PDF-файл с таблицей. Пока все работает нормально, но теперь я хочу добавить функцию обертывания. Поэтому мне нужно вставить перевод строки. contentStream.beginText (); contentStream.moveTextPositionByAmount (x, ...
вопрос задан: 23 June 2017 14:32
0
ответов

Отключение ведения журнала в PDFBox

Мы используем PDFBox для чтения и обработки PDF-файлов. Но во время синтаксического анализа я получаю кучу сообщений, подобных этому :Изменение шрифта на с на шрифт по умолчанию...
вопрос задан: 23 May 2017 11:54
0
ответов

Как получить цвет шрифта с помощью pdfbox

Я пытаюсь извлечь текст со всей информацией из pdf с помощью pdfbox. У меня есть вся информация, которую я хочу, кроме цвета. Я пробовал разные способы получить цвет шрифта (включая получение цвета текста...
вопрос задан: 23 May 2017 10:29
0
ответов

Извлечение таблицы PDF

У меня есть (одни и те же )данные, сохраненные как файл изображения GIF и как файл PDF, и я хочу преобразовать их в HTML или XML. На самом деле данные — это меню столовой моего университета. Это означает, что есть новый...
вопрос задан: 19 May 2017 10:44
0
ответов

Java-библиотека Apache PDFBox - есть ли API для создания таблиц?

Я использую java-библиотеку Apache PDFBox для создания PDF-файлов. Есть ли способ создать таблицу данных с помощью pdfbox? Если для этого нет такого API, мне нужно было бы вручную нарисовать таблицу, используя ...
вопрос задан: 12 May 2017 22:19
0
ответов

Извлечь изображение из PDF с помощью Java

Мне нужно извлечь штрих-код только из PDF (используя прямоугольник), а не преобразовывать весь PDF в изображение. Формат изображения может быть jpg / png.
вопрос задан: 26 July 2016 13:51
0
ответов

Как центрировать текст с помощью PDFBox

Мой вопрос очень простой: как я могу центрировать текст в PDF с помощью PDFBox? Струнку заранее не знаю, пробой середину не найду. Строка не всегда имеет одинаковую ширину. Я ...
вопрос задан: 15 December 2015 10:47