Лучший алгоритм сжатия для XML?

Question

Лучший алгоритм сжатия для XML?

 UPDATE ( SELECT t1.value, t2.CODE
          FROM table1 t1
          INNER JOIN table2 t2 ON t1.Value = t2.DESC
          WHERE t1.UPDATETYPE='blah')
 SET t1.Value= t2.CODE

30

xml algorithm text compression zip

задан Brady Moritz 26 September 2013 в 18:59

6 ответов

Похоже, вас больше интересует сжатие, а не шифрование. Так ли это? Если так, то это может оказаться интересным для чтения, хотя и не является точным решением.

2

ответ дан 27 November 2019 в 22:30

Между прочим, сценарий таков: я создаю стандарт для документов, таких как ODF или MS Office XML, которые содержат файлы XML, упакованные в .zip .

то я бы посоветовал вам использовать сжатие .zip, иначе ваши пользователи запутаются.

1

ответ дан 27 November 2019 в 22:30

Надеюсь, я правильно понял, что вам нужно сделать ... Первое, что я хотел бы сказать, это то, что нет хорошего или плохого сжатия алгоритмы для текста - zip, bzip, gzip, rar, 7zip достаточно хороши для сжатия все, что имеет низкую энтропию - т.е. большой файл с небольшим набором символов. Если бы мне пришлось их использовать, я бы выбрал 7zip на свой первый выбор, rar как второй и третий. Но разница очень мала, поэтому стоит попробовать все, что вам будет проще. Во-вторых, я не мог понять, что вы пытаетесь зашифровать. Предположим, что это XML-файл, тогда вы должны сначала сжать его, используя свой любимый алгоритм сжатия, а затем зашифровать его с помощью вашего любимого шифрования алгоритм. В большинстве случаев любой современный алгоритм, реализованный, например, в PGP будет достаточно безопасным для чего угодно. Надеюсь, это поможет.

0

ответ дан 27 November 2019 в 22:30

Ваши альтернативы:

Используйте веб-сервер, поддерживающий сжатие gzip. Он автоматически сжимает весь исходящий HTML. Однако есть небольшая нагрузка на ЦП
Используйте что-то вроде JSON. Это резко уменьшит размер сообщения.
Также есть двоичный XML, но я сам не пробовал.

0

ответ дан 27 November 2019 в 22:30

Another alternative to "compress" XML would be FI (Fast Infoset).

XML, stored as FI, would contain every tag and attribute only once, all other occurrences are referencing the first one, thus saving space.

See:

Very good article on java.sun.com, and of course
the Wikipedia entry

The difference to EXI from the compression point of view is that Fast Infoset (being structured plaintext) is less efficient.

Other important difference is: FI is a mature standard with many implementations.
One of them: Fast Infoset Project @ dev.java.net

5

ответ дан 27 November 2019 в 22:30

Другие вопросы по тегам:

xml algorithm text compression zip

Лучший алгоритм сжатия для XML?

6 ответов

Похожие вопросы: