6.4.2 / 2 Оператор switch
(выделение)
Условие должно быть целочисленного типа, типа перечисления или типа класса, для которого один неявный существует функция преобразования в интегральный или перечисляемый тип (12.3). Если условие имеет тип класса, условие преобразуется путем вызова этой функции преобразования, а результат преобразования используется вместо исходного условия для остальной части этого раздела.
blockquote>Поэтому моя интерпретация заключается в том, что g ++ здесь верен.
Текст можно легко проанализировать следующим образом:
# gem install pdf-reader
require 'pdf-reader'
reader = PDF::Reader.new('my.pdf')
reader.pages.each do |page|
puts page.text
end
Это можно сделать с помощью той же библиотеки , См. Пример script examples / extract_images.rb .
Это (еще не) полный ответ. Теперь следующие шаги:
pdf-reader
является одним из решений. Но у него есть проблемы, иногда он не дает текст в надлежащем формате. Я использовал его.
Я предлагаю использовать docsplit . Вы найдете дополнительную информацию о «pdf-reader» и «docsplit» в в этом сообщении в блоге .
Надеюсь, это поможет. Если какие-либо разъяснения требуются, не стесняйтесь комментировать.