Я хотел бы сделать Regex. Разделение на некоторых разделителях, но я хотел бы сохранить разделители. Для предоставления примера того, что я пробую:
"abc[s1]def[s2][s3]ghi" --> "abc", "[s1]", "def", "[s2]", "[s3]", "ghi"
Регулярное выражение, которое я придумал, new Regex("\\[|\\]|\\]\\[")
. Однако это дает мне следующее:
"abc[s1]def[s2][s3]ghi" --> "abc", "s1", "def", "s2", "", "s3", "ghi"
Разделители исчезли (который имеет смысл, учитывая мой regex). Существует ли способ записать regex так, чтобы сами разделители были сохранены?
Используйте обходные пути обработки нулевой длины; вы хотите разделить на
(?=\[)|(?<=\])
То есть везде, где мы утверждаем совпадение литерала [
впереди, или где мы утверждаем совпадение литерала ]
позади.
Как строковый литерал в C#, это
@"(?=\[)|(?<=\])"
System.out.println(java.util.Arrays.toString(
"abc[s1]def[s2][s3]ghi".split("(?=\\[)|(?<=\\])")
));
// prints "[abc, [s1], def, [s2], [s3], ghi]"
System.out.println(java.util.Arrays.toString(
"abc;def;ghi;".split("(?<=;)")
));
// prints "[abc;, def;, ghi;]"
System.out.println(java.util.Arrays.toString(
"OhMyGod".split("(?=(?!^)[A-Z])")
));
// prints "[Oh, My, God]"
Вы можете использовать .Matches
вместо .Split
, например ( http://www.ideone.com/gUjRM ):
string x = "abc[s1]def[s2][s3]ghi";
var r = new Regex(@"[^\[]+|\[[^\]]+\]");
var ms = r.Matches(x);
// do stuff with the MatchCollection `ms`.