Создание массива из текстового файла в Bash

Получение текста

Текст можно легко проанализировать следующим образом:

# gem install pdf-reader
require 'pdf-reader'

reader = PDF::Reader.new('my.pdf')

reader.pages.each do |page|
  puts page.text
end

Сохранение изображения

Это можно сделать с помощью той же библиотеки , См. Пример script examples / extract_images.rb .

Однако

Это (еще не) полный ответ. Теперь следующие шаги:

  1. Разбор текста и поиск заголовков
  2. Обрезка изображения, которое может быть достигнуто с помощью библиотеки, такой как RMagick или Mini Magick .
63
задан codeforester 6 February 2017 в 04:47
поделиться