Использовать textract.
Он поддерживает множество типов файлов, включая файлы PDF
import textract
text = textract.process("path/to/file.extension")
Это, кажется, работает, хотя это кажется нелогичным, что http://us.php.net/date документы спецификатор микросекунды все же действительно не поддерживает его:
function getTimestamp()
{
return date("Y-m-d\TH:i:s") . substr((string)microtime(), 1, 8);
}
Строка в формате, принятом strtotime (), Это работает!
: Строка в формате, принятом strtotime (), значения по умолчанию к "теперь".
: строка для парсинга, согласно GNU В» синтаксис Форматов ввода Даты. Перед PHP 5.0.0, микросекунды не были позволены во время, начиная с PHP 5.0.0, им позволяют, но игнорируют.
Эта функция вытянула от http://us3.php.net/date
function udate($format, $utimestamp = null)
{
if (is_null($utimestamp))
$utimestamp = microtime(true);
$timestamp = floor($utimestamp);
$milliseconds = round(($utimestamp - $timestamp) * 1000000);
return date(preg_replace('`(?<!\\\\)u`', $milliseconds, $format), $timestamp);
}
echo udate('H:i:s.u'); // 19:40:56.78128
Очень странный, необходимо реализовать эту функцию, чтобы заставить "u" работать...: \