Просто используйте DOMDocument-> loadHTML () и быть сделанными с ним. алгоритм парсинга HTML libxml довольно хорош и быстр, и вопреки широко распространенному мнению, не дросселирует на уродливом HTML.
Раньше это был единственный способ определить размер файла перед отправкой файла к серверу должны были иметь клиентские плагины / надстройки «толще, чем javascript». Их нужно будет установить в клиентской системе. Например, с помощью SWFUpload, Java-апплетов, элементов управления ActiveX.
Теперь вы можете использовать API файлов HTML5, например:
var size = document.getElementById('myfile').files[0].size;