Относительная терминология TCP/IP, которая является тем, что я принимаю, подразумевается вопросом. В терминах неспециалиста:
ПОРТ А похож на номер телефона конкретного дома в конкретном почтовом индексе. Почтовый индекс города мог считаться IP-адресом города и всех зданий в том городе.
СОКЕТ А, с другой стороны, больше похож на установленный телефонный вызов между телефонами пары зданий, говорящих друг с другом. Те вызовы могут быть установлены между зданиями в том же городе или двумя зданиями в различных городах. Именно той временной установленной трассой между парой телефонов, говорящих друг с другом, является СОКЕТ.
Сжатие файлов устраняет избыточность. Поэтому файлы с небольшой избыточностью сжимаются плохо или не сжимаются вообще.
Типы файлов без избыточности, с которыми вы, скорее всего, столкнетесь, - это уже сжатые файлы. В случае PDF, это, в частности, PDF-файлы, которые состоят в основном из изображений, которые сами находятся в формате сжатого изображения, таком как JPEG.
Вы можете добавить все форматы файлов Office 2007 в список (из @waqasahmed):
Поскольку .docx и .xlsx (и т. Д.) Office 2007 фактически являются заархивированными файлами .xml, вы также может не сильно уменьшиться в размерах.
Медиа-файлы плохо сжимаются. JPEG и MPEG не сжимаются, хотя вы можете сжимать файлы .png
На самом деле все зависит от используемого алгоритма. Алгоритм, специально предназначенный для использования частоты букв, встречающихся в общих английских словах, будет плохо работать, если входной файл не соответствует этому предположению.
В общем, PDF-файлы содержат изображения и другие изображения, которые уже сжаты, поэтому он будет не сжимайте намного дальше. Ваш алгоритм, вероятно, сможет сэкономить лишь скудную экономию на текстовых строках, содержащихся в PDF?
Файл, который уже сжат, обычно не может быть сжат дальше. Например, mp3, jpg, flac и т. Д. Вы даже можете получить файлы большего размера из-за повторно сжатого заголовка файла.
Простой ответ: сжатые файлы (или мы могли бы уменьшить размер файла до 0, сжав несколько раз :).
Вы, вероятно, также столкнетесь с трудностями при сжатии зашифрованных файлов, поскольку они по сути случайны и (как правило) имеют мало повторяющиеся блоки.
Файлы, зашифрованные с помощью хорошего алгоритма, такого как IDEA или DES в режиме CBC, больше не сжимаются независимо от их исходного содержимого. Вот почему программы шифрования сначала сжимают, а только потом запускают шифрование.
Файлы PDF уже сжаты. Они используют следующие алгоритмы сжатия:
В зависимости от того, какой инструмент создал PDF-файл и версию, используются разные типы шифрования. Вы можете сжимать его дальше, используя более эффективный алгоритм, немного теряя качество путем преобразования изображений в JPEG низкого качества.
Здесь есть отличная ссылка
Единственные файлы, которые не могут быть сжаты, - это случайные файлы - действительно случайные биты, или приблизительно равные выходным данным компрессора.
Однако для любого алгоритма в целом существует много файлов которые не могут быть сжаты им, но могут быть хорошо сжаты другим алгоритмом.
jpeg / gif / avi / mpeg / mp3 и уже сжатые файлы не сильно изменятся после сжатия. Вы можете увидеть небольшое уменьшение размера файла.
Обычно вы не можете сжимать данные, которые уже были сжаты. У вас может даже получиться сжатый размер, превышающий исходный.