У меня есть несколько старых файлов Microsoft Word (вероятно, Word 97), и я заметил, что стандартная файловая утилита Unix идентифицирует такие файлы как «CDF». На самом деле он более точен, выгрузка подробных метаданных, например:
CDF V2 Document,
Little Endian,
Os: Windows,
Version 4.0,
Code page: 1252,
Title: ...,
Author: ...,
Template: Normal.dot,
Last Saved By: ...,
Revision Number: 1,
Name of Creating Application: Microsoft Word 8.0,
Create Time/Date: ...,
Last Saved Time/Date: ...,
Number of Pages: 1,
Number of Words: 95,
Number of Characters: 542,
Security: 0
Что означает этот CDF? Это какой-то общий контейнерный формат, например RIFF для медиафайлов? Я не могу найти ничего полезного в Интернете. "Формат определения канала" и "Формат составного документа" явно не подразумеваются, поскольку эти файлы Microsoft Word являются полностью двоичными. Для Common Data Format Я не могу найти соединение. Я попытался найти что-то в исходном коде файла util (в версии, поставляемой с FreeBSD), но смог только узнать, что у него есть специальный readcdf.c
, который работает с этим форматом.