GZipStream не обнаруживает поврежденные данные (даже проходы CRC32)?

Question

GZipStream не обнаруживает поврежденные данные (даже проходы CRC32)?

Я использую GZipStream для сжатия / распаковки данных. Я выбрал это вместо DeflateStream, поскольку в документации указано, что GZipStream также добавляет CRC для обнаружения поврежденных данных, что является еще одной функцией, которую я хотел. Мои «положительные» модульные тесты работают хорошо, так как я могу сжать некоторые данные, сохранить сжатый массив байтов и затем снова успешно распаковать его. Сообщение .NET GZipStream о проблеме сжатия и распаковки помогло мне понять, что мне нужно закрыть GZipStream перед доступом к сжатым или распакованным данным.

Затем я продолжил писать «отрицательный» модульный тест, чтобы убедиться, что поврежденные данные могут быть обнаружены. Ранее я использовал пример для класса GZipStream из MSDN , чтобы сжать файл, открыть сжатый файл в текстовом редакторе, изменить байт, чтобы повредить его (как если бы открытие его в текстовом редакторе не было достаточно плохо!), сохраните его, а затем распакуйте, чтобы убедиться, что я получил InvalidDataException, как ожидалось.

Когда я писал модульный тест, я выбрал произвольный байт для повреждения (например, compressedDataBytes [50] = 0x99) и получил InvalidDataException. Все идет нормально. Мне было любопытно, поэтому я выбрал другой байт, но, к моему удивлению, не получил исключения. Это может быть нормально (например,, Я случайно попал в неиспользуемый байт в блоке данных), пока данные все еще могут быть успешно восстановлены. Однако я тоже не получил верных данных!

Чтобы быть уверенным, что «это был не я», я взял очищенный код из нижней части .NET GZipStream: проблема сжатия и распаковки и модифицировал его для последовательного повреждения каждого байта сжатых данных до тех пор, пока он не смог правильно распаковать. Вот изменения (обратите внимание, что я с использованием тестовой среды Visual Studio 2010):

// successful compress / decompress example code from:
//    https://stackoverflow.com/questions/1590846/net-gzipstream-compress-and-decompress-problem
[TestMethod]
public void Test_zipping_with_memorystream_and_corrupting_compressed_data()
{
   const string sample = "This is a compression test of microsoft .net gzip compression method and decompression methods";
   var encoding = new ASCIIEncoding();
   var data = encoding.GetBytes(sample);
   string sampleOut = null;
   byte[] cmpData;

   // Compress 
   using (var cmpStream = new MemoryStream())
   {
      using (var hgs = new GZipStream(cmpStream, CompressionMode.Compress))
      {
         hgs.Write(data, 0, data.Length);
      }
      cmpData = cmpStream.ToArray();
   }

   int corruptBytesNotDetected = 0;

   // corrupt data byte by byte
   for (var byteToCorrupt = 0; byteToCorrupt < cmpData.Length; byteToCorrupt++)
   {
      // corrupt the data
      cmpData[byteToCorrupt]++;

      using (var decomStream = new MemoryStream(cmpData))
      {
         using (var hgs = new GZipStream(decomStream, CompressionMode.Decompress))
         {
            using (var reader = new StreamReader(hgs))
            {
               try
               {
                  sampleOut = reader.ReadToEnd();

                  // if we get here, the corrupt data was not detected by GZipStream
                  // ... okay so long as the correct data is extracted
                  corruptBytesNotDetected++;

                  var message = string.Format("ByteCorrupted = {0}, CorruptBytesNotDetected = {1}",
                     byteToCorrupt, corruptBytesNotDetected);

                  Assert.IsNotNull(sampleOut, message);
                  Assert.AreEqual(sample, sampleOut, message);
               }
               catch(InvalidDataException)
               {
                  // data was corrupted, so we expect to get here
               }
            }
         }
      }

      // restore the data
      cmpData[byteToCorrupt]--;
   }
}

Когда я запускаю этот тест, я получаю:

Assert.AreEqual failed. Expected:. Actual:<>. ByteCorrupted = 11, CorruptBytesNotDetected = 8

Итак, это означает, что на самом деле было 7 случаев, когда повреждение данных не имело никакого значения (строка была успешно восстановлена), но искажение байт 11 не вызвал исключения и не восстановил данные.

Я что-то упускаю или делаю что-то не так? Кто-нибудь может понять, почему поврежденные сжатые данные не обнаруживаются?

5

compression gzipstream corrupt-data

задан Community 23 May 2017 в 12:12

0 ответов

Другие вопросы по тегам:

compression gzipstream corrupt-data

GZipStream не обнаруживает поврежденные данные (даже проходы CRC32)?

0 ответов

Похожие вопросы: