Java: удалите continious сегмент нулей от массива байтов

Question

Java: удалите continious сегмент нулей от массива байтов

UML кажется пользе для крупных проектов с многочисленными командами людей. Однако я работал в малочисленных командах, где коммуникация лучше.

Используя схемы UML-esque хорошо хотя, особенно в перспективном проектировании. Я склонен думать в коде, таким образом, я нахожу пишущие большие спецификации трудно. Я предпочитаю записывать вводы и выводы и оставлять разработчиков для разработки бита в середине.

5

java arrays regex

задан try-catch-finally 30 July 2017 в 11:05

7 ответов

byte[] a = {1,2,3,0,1,2,3,0,0,0,0,4};
String s0 = new String(a, "ISO-8859-1");
String s1 = s0.replaceAll("\\x00{4,}", "");
byte[] r = s1.getBytes("ISO-8859-1");

System.out.println(Arrays.toString(r)); // [1, 2, 3, 0, 1, 2, 3, 4]

Я использовал ISO-8859-1 (latin1), потому что, в отличие от любой другой кодировки,

каждый байт в диапазоне 0x00..0xFF отображается на допустимый символ, а
каждый из эти символы имеют то же числовое значение, что и его кодировка latin1.

Это означает, что строка имеет ту же длину, что и исходный массив байтов, вы можете сопоставить любой байт по его числовому значению с помощью конструкции \ xFF , и вы можете преобразовать полученную строку обратно в массив байтов без потери информации.

Я бы не стал пытаться отображать данные в строковой форме - хотя все символы действительны, многие из них не печатаются. Также избегайте манипулирования данными, пока они находятся в строковой форме; вы можете случайно выполнить некоторые замены escape-последовательности или другое преобразование кодировки, не осознавая этого. На самом деле, я бы не стал t рекомендуют вообще делать такие вещи, но вы не об этом просили. :)

Также имейте в виду, что этот метод не обязательно будет работать на других языках программирования или разновидностях регулярных выражений. Вам придется протестировать каждую отдельно.

26