Как извлечь текстовый слой и фоновый слой из pdf?

В моем проекте я должен сделать PDF Viewer в HTML5/CSS3, и приложение должно разрешить пользователю добавлять комментарии и аннотации. Вообще-то, я должен сделать что-то очень похожее на crocodoc.com.

Вначале я думал создать изображения из PDF и разрешить пользователям создавать области и размещать комментарии, связанные с этой областью. К сожалению, клиент также хочет перемещаться в этом документе PDF и добавлять только комментарии к разрешенным разделам (например, абзацы или выделенный текст).

И теперь я перед одной проблемой, которая состоит в том, чтобы получить текст и лучший способ сделать это. Если у любого тела есть подсказки, как я могу достичь его, я был бы признателен.

Я попробовал pdftohtml , но вывод не похож на исходный документ, который действительно сложен ( пример документа ). Даже этот не отражает действительно выход, но намного лучше, чем pdftohtml .

Я открыт для любых решений, с предпочтением командной строки под linux.

-121--1685049-

Запрос GET от PHP с использованием file_get_contents с параметрами Я хочу отправить запрос GET на внешний сайт, но также хочу отправить некоторые параметры, например, я должен отправить запрос на получение, example.com я хочу выполнить www.example.com/send.php?uid=1&pwd=...

Я хочу отправить запрос на получение на внешний сайт, но также хочу отправить некоторые параметры

, например, я должен отправить запрос на получение example.com

я хочу выполнить www.example.com/send.php?uid=1&pwd=2&msg=3&phone=3&provider=xyz

Мой код:

$getdata = http_build_query(
array(
    'uid' => '1',
    'pwd' => '2',
 'msg'=>'3',
 'phone'=>'9999',
 'provider'=>'xyz'
 )
);

$opts = array('http' =>
 array(
    'method'  => 'GET',
    'content' => $getdata
)
);

$context  = stream_context_create($opts);

$result = file_get_contents('http://example.com/send.php', false, $context);

Я получаю ошибку сервера.

12
задан Anant 8 September 2011 в 18:33
поделиться