regex для парсинга номера версии

Что такое NullPointerException?

Хорошим местом для начала является JavaDocs . Они охватывают это:

Брошено, когда приложение пытается использовать null в случае, когда требуется объект. К ним относятся:

  • Вызов метода экземпляра нулевого объекта.
  • Доступ или изменение поля нулевого объекта.
  • Выполнение длины null, как если бы это был массив.
  • Доступ или изменение слотов с нулевым значением, как если бы это был массив.
  • Бросать нуль, как если бы это было значение Throwable.

Приложения должны бросать экземпляры этого класса для указания других незаконных видов использования нулевого объекта.

blockquote>

Также, если вы попытаетесь использовать нулевую ссылку с synchronized, который также выдаст это исключение, за JLS :

SynchronizedStatement:
    synchronized ( Expression ) Block
  • В противном случае, если значение выражения равно null, NullPointerException.
blockquote>

Как это исправить?

Итак, у вас есть NullPointerException. Как вы это исправите? Возьмем простой пример, который выдает NullPointerException:

public class Printer {
    private String name;

    public void setName(String name) {
        this.name = name;
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer();
        printer.print();
    }
}

Идентифицирует нулевые значения

. Первый шаг - точно определить , значения которого вызывают исключение . Для этого нам нужно выполнить некоторую отладку. Важно научиться читать stacktrace . Это покажет вам, где было выбрано исключение:

Exception in thread "main" java.lang.NullPointerException
    at Printer.printString(Printer.java:13)
    at Printer.print(Printer.java:9)
    at Printer.main(Printer.java:19)

Здесь мы видим, что исключение выбрано в строке 13 (в методе printString). Посмотрите на строку и проверьте, какие значения равны нулю, добавив протоколирующие операторы или используя отладчик . Мы обнаруживаем, что s имеет значение null, а вызов метода length на него вызывает исключение. Мы видим, что программа прекращает бросать исключение, когда s.length() удаляется из метода.

Трассировка, где эти значения взяты из

Затем проверьте, откуда это значение. Следуя вызовам метода, мы видим, что s передается с printString(name) в методе print(), а this.name - null.

Трассировка, где эти значения должны быть установлены

Где установлен this.name? В методе setName(String). С некоторой дополнительной отладкой мы видим, что этот метод вообще не вызывается. Если этот метод был вызван, обязательно проверьте порядок , что эти методы вызывают, а метод set не будет называться после методом печати. ​​

Этого достаточно, чтобы дать нам решение: добавить вызов printer.setName() перед вызовом printer.print().

Другие исправления

Переменная может иметь значение по умолчанию setName может помешать ему установить значение null):

private String name = "";

Либо метод print, либо printString может проверить значение null например:

printString((name == null) ? "" : name);

Или вы можете создать класс, чтобы name всегда имел ненулевое значение :

public class Printer {
    private final String name;

    public Printer(String name) {
        this.name = Objects.requireNonNull(name);
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer("123");
        printer.print();
    }
}

См. также:

Я все еще не могу найти проблему

Если вы попытались отладить проблему и до сих пор не имеете решения, вы можете отправить вопрос для получения дополнительной справки, но не забудьте включить то, что вы пробовали до сих пор. Как минимум, включите stacktrace в вопрос и отметьте важные номера строк в коде. Также попробуйте сначала упростить код (см. SSCCE ).

73
задан Andrew Borley 28 December 2017 в 09:32
поделиться

13 ответов

Я выразил бы формат как:

"1-3 разделенных от точки компонента, каждый числовой за исключением того, что последний может быть *"

Как regexp, это:

^(\d+\.)?(\d+\.)?(\*|\d+)$

[Редактирование для добавления: этим решением является краткий способ проверить, но было указано, что извлечение значений требует дополнительной работы. Это - вопрос вкуса, иметь ли дело с этим путем усложнения regexp, или путем обработки подобранных групп.

В моем решении группы получают "." персонажи. С этим можно иметь дело с использованием негрупп фиксации как в ответе ajborley.

Кроме того, самая правая группа получит последний компонент, даже если будет меньше чем три компонента, и таким образом, например, двухкомпонентный вход приводит к первому и последнему получению групп и среднему неопределенному. Я думаю, что с этим могут иметь дело нежадные группы, где поддерживается.

Код Perl, чтобы заниматься обеими проблемами после regexp мог быть чем-то вроде этого:

@version = ();
@groups = ($1, $2, $3);
foreach (@groups) {
    next if !defined;
    s/\.//;
    push @version, $_;
}
($major, $minor, $mod) = (@version, "*", "*");

Который не является действительно немного короче, чем разделение на "." ]

80
ответ дан Alexander Taylor 24 November 2019 в 12:12
поделиться

Кажется довольно трудным иметь regex, который делает точно, что Вы хотите (т.е. примите только случаи, в которых Вы нуждаетесь и отклоняете весь другие и возврат некоторые группы для этих трех компонентов). Я имею, дают ему попытку и придумывают это:

^(\*|(\d+(\.(\d+(\.(\d+|\*))?|\*))?))$

IMO (я не протестировал экстенсивно) это должно хорошо работать как блок проверки допустимости для входа, но проблема состоит в том, что этот regex не предлагает способ получить компоненты. Для этого все еще необходимо сделать разделение на периоде.

Это решение не едино, но большинство раз в программировании его не должен. Конечно, это зависит от других ограничений, которые Вы могли бы иметь в своем коде.

2
ответ дан rslite 24 November 2019 в 12:12
поделиться

Следует иметь в виду, что regexp являются жадными, поэтому если Вы просто ищете в строке номера версии а не в рамках большего текста, используйте ^, и $ для маркировки запускаются и конец строки. regexp от Greg, кажется, хорошо работает (просто дал ему быструю попытку в моем редакторе), но в зависимости от Вашей библиотеки/языка первая часть может все еще соответствовать "*" в числах неверной версии. Возможно, я пропускаю что-то, поскольку я не использовал Regexp в течение года или около этого.

Это должно удостовериться, что можно только найти числа правильной версии:

^ (\* |\d + (\.\d +) * (\.\*)?) $

редактирование: на самом деле greg уже добавил их и даже улучшил его решение, я являюсь слишком медленным:)

2
ответ дан FrankS 24 November 2019 в 12:12
поделиться

Это соответствует 1.2.3.* также

^ (* |\d + (.\d +) {0,2} (.*)?) $

я предложил бы менее изящное:

(* | \d + (.\d +)? (.*)?) | \d +.\d +.\d +)

2
ответ дан Victor 24 November 2019 в 12:12
поделиться
(?ms)^((?:\d+(?!\.\*)\.)+)(\d+)?(\.\*)?$|^(\d+)\.\*$|^(\*|\d+)$

Действительно точно соответствует Вашим 6 первым примерам и отклоняет эти 4 других

  • группа 1: главный или major.minor или '* '
  • группа 2, если существует: незначительный или *
  • группа 3, если существует: *

можно ли удалить' (? мс)'
я использовал его для указания к этому regexp, который будет применен на мультилинии до QuickRex

2
ответ дан VonC 24 November 2019 в 12:12
поделиться
^(?:(\d+)\.)?(?:(\d+)\.)?(\*|\d+)$

, Возможно, более краткий мог быть:

^(?:(\d+)\.){0,2}(\*|\d+)$

Это может тогда быть улучшено к 1.2.3.4.5.* или ограниченный точно X.Y.Z, использующим * или {2} вместо {0,2}

3
ответ дан ofaurax 24 November 2019 в 12:12
поделиться

Я склонен соглашаться с предложением разделения.

Ive создал "тестер" для Вашей проблемы в жемчуге

#!/usr/bin/perl -w


@strings = ( "1.2.3", "1.2.*", "1.*","*" );

%regexp = ( svrist => qr/(?:(\d+)\.(\d+)\.(\d+)|(\d+)\.(\d+)|(\d+))?(?:\.\*)?/,
            onebyone => qr/^(\d+\.)?(\d+\.)?(\*|\d+)$/,
            greg => qr/^(\*|\d+(\.\d+){0,2}(\.\*)?)$/,
            vonc => qr/^((?:\d+(?!\.\*)\.)+)(\d+)?(\.\*)?$|^(\d+)\.\*$|^(\*|\d+)$/,
            ajb => qr/^(?:(\d+)\.)?(?:(\d+)\.)?(\*|\d+)$/,
            jrudolph => qr/^(((\d+)\.)?(\d+)\.)?(\d+|\*)$/
          );

  foreach my $r (keys %regexp){
    my $reg = $regexp{$r};
    print "Using $r regexp\n";
foreach my $s (@strings){
  print "$s : ";

    if ($s =~m/$reg/){
    my ($main, $maj, $min,$rev,$ex1,$ex2,$ex3) = ("any","any","any","any","any","any","any");
    $main = $1 if ($1 && $1 ne "*") ;
    $maj = $2 if ($2 && $2 ne "*") ;
    $min = $3 if ($3 && $3 ne "*") ;
    $rev = $4 if ($4 && $4 ne "*") ;
    $ex1 = $5 if ($5 && $5 ne "*") ;
    $ex2 = $6 if ($6 && $6 ne "*") ;
    $ex3 = $7 if ($7 && $7 ne "*") ;
    print "$main $maj $min $rev $ex1 $ex2 $ex3\n";

  }else{
  print " nomatch\n";
  }
  }
print "------------------------\n";
}

Текущая производительность:

> perl regex.pl
Using onebyone regexp
1.2.3 : 1. 2. 3 any any any any
1.2.* : 1. 2. any any any any any
1.* : 1. any any any any any any
* : any any any any any any any
------------------------
Using svrist regexp
1.2.3 : 1 2 3 any any any any
1.2.* : any any any 1 2 any any
1.* : any any any any any 1 any
* : any any any any any any any
------------------------
Using vonc regexp
1.2.3 : 1.2. 3 any any any any any
1.2.* : 1. 2 .* any any any any
1.* : any any any 1 any any any
* : any any any any any any any
------------------------
Using ajb regexp
1.2.3 : 1 2 3 any any any any
1.2.* : 1 2 any any any any any
1.* : 1 any any any any any any
* : any any any any any any any
------------------------
Using jrudolph regexp
1.2.3 : 1.2. 1. 1 2 3 any any
1.2.* : 1.2. 1. 1 2 any any any
1.* : 1. any any 1 any any any
* : any any any any any any any
------------------------
Using greg regexp
1.2.3 : 1.2.3 .3 any any any any any
1.2.* : 1.2.* .2 .* any any any any
1.* : 1.* any .* any any any any
* : any any any any any any any
------------------------
5
ответ дан svrist 24 November 2019 в 12:12
поделиться

Не знайте, какая платформа Вы идете, но в.NET существует Система. Класс версии, который проанализирует "n.n.n.n" номера версий для Вас.

7
ответ дан Duncan Smart 24 November 2019 в 12:12
поделиться

Спасибо за все ответы! Это первоклассно:)

На основе ответа OneByOne (который смотрел самое простое мне), я добавил некоторые негруппы фиксации (' (?': части - благодаря VonC для представления меня к негруппам фиксации!), таким образом, группы, которые действительно получают только, содержат цифры или * символ.

^(?:(\d+)\.)?(?:(\d+)\.)?(\*|\d+)$

Большое спасибо все!

11
ответ дан Andrew Borley 24 November 2019 в 12:12
поделиться

Это могло бы работать:

^(\*|\d+(\.\d+){0,2}(\.\*)?)$

На верхнем уровне, "*" особый случай числа действительной версии. Иначе это запускается с числа. Тогда существует нуль, один, или две последовательности ".nn", сопровождаемые дополнительным ".*". Этот regex принял бы 1.2.3.* который может или не может быть разрешен в Вашем приложении.

код для получения подобранных последовательностей, особенно (\.\d+){0,2} часть, будет зависеть от Вашей конкретной regex библиотеки.

11
ответ дан Greg Hewgill 24 November 2019 в 12:12
поделиться

Использование regex и теперь у Вас есть две проблемы. я разделил бы вещь на точках (". "), затем удостоверьтесь, что каждая часть является или подстановочным знаком или набором цифр (regex, прекрасно теперь). Если вещь допустима, Вы просто возвращаете корректный блок разделения.

38
ответ дан Paweł Hajdan 24 November 2019 в 12:12
поделиться

Другая попытка:

^(((\d+)\.)?(\d+)\.)?(\d+|\*)$

Это дает эти три части в группах 4,5,6, НО: Они выровненные направо. Так первый непустой указатель один из 4,5 или 6 дает поле версии.

  • 1.2.3 дает 1,2,3
  • 1.2.* дает 1,2, *
  • 1.2 дает пустой указатель, 1,2
  • , *** дает пустой указатель, пустой указатель, *
  • 1.* дает пустой указатель, 1, *
3
ответ дан jrudolph 24 November 2019 в 12:12
поделиться

Это должно работать для того, что вы предусмотрели. Он зависит от позиции подстановочного ввода и является вложенным regex:

^((\*)|([0-9]+(\.((\*)|([0-9]+(\.((\*)|([0-9]+)))?)))?))$

http://imgur.com/3E492.png

4
ответ дан 24 November 2019 в 12:12
поделиться
Другие вопросы по тегам:

Похожие вопросы: