Узнайте количество групп получения в регулярных выражениях Python

В Java все переменные, которые вы объявляете, на самом деле являются «ссылками» на объекты (или примитивы), а не самими объектами.

При попытке выполнить один метод объекта , ссылка просит живой объект выполнить этот метод. Но если ссылка ссылается на NULL (ничего, нуль, void, nada), то нет способа, которым метод будет выполнен. Тогда runtime сообщит вам об этом, выбросив исключение NullPointerException.

Ваша ссылка «указывает» на нуль, таким образом, «Null -> Pointer».

Объект живет в памяти виртуальной машины пространство и единственный способ доступа к нему - использовать ссылки this. Возьмем этот пример:

public class Some {
    private int id;
    public int getId(){
        return this.id;
    }
    public setId( int newId ) {
        this.id = newId;
    }
}

И в другом месте вашего кода:

Some reference = new Some();    // Point to a new object of type Some()
Some otherReference = null;     // Initiallly this points to NULL

reference.setId( 1 );           // Execute setId method, now private var id is 1

System.out.println( reference.getId() ); // Prints 1 to the console

otherReference = reference      // Now they both point to the only object.

reference = null;               // "reference" now point to null.

// But "otherReference" still point to the "real" object so this print 1 too...
System.out.println( otherReference.getId() );

// Guess what will happen
System.out.println( reference.getId() ); // :S Throws NullPointerException because "reference" is pointing to NULL remember...

Это важно знать - когда больше нет ссылок на объект (в пример выше, когда reference и otherReference оба указывают на null), тогда объект «недоступен». Мы не можем работать с ним, поэтому этот объект готов к сбору мусора, и в какой-то момент VM освободит память, используемую этим объектом, и выделит другую.

35
задан Community 23 May 2017 в 11:47
поделиться

6 ответов

def num_groups(regex):
    return re.compile(regex).groups
37
ответ дан Markus Jarderot 27 November 2019 в 07:09
поделиться

lastindex свойство объекта соответствия должно быть тем, что Вы ищете. Посмотрите документы .

модуля ре
2
ответ дан agnul 27 November 2019 в 07:09
поделиться

Что-то из sre_parse могло бы помочь.

На первый взгляд, возможно, что-то вроде:

>>> import sre_parse
>>> sre_parse.parse('(\d)\d(\d)')
[('subpattern', (1, [('in', [('category', 'category_digit')])])), 
('in', [('category', 'category_digit')]), 
('subpattern', (2, [('in', [('category', 'category_digit')])]))]

Т.е. количество объекты типа 'подшаблон':

import sre_parse

def count_patterns(regex):
    """
    >>> count_patterns('foo: \d')
    0
    >>> count_patterns('foo: (\d)')
    1
    >>> count_patterns('foo: (\d(\s))')
    1
    """
    parsed = sre_parse.parse(regex)
    return len([token for token in parsed if token[0] == 'subpattern'])

Примечание, что мы только считаем корневые шаблоны уровня здесь, таким образом, последний пример только возвращается 1. Для изменения этого , маркерам было бы нужно к искавшему рекурсивно.

2
ответ дан miracle2k 27 November 2019 в 07:09
поделиться

В первую очередь, если Вам только нужен первый результат re.findall, лучше просто использовать re.search, который возвращает соответствие или Ни один.

Для числа групп Вы могли считать количество открывающей скобки' (' кроме тех, которых оставляют '\'. Вы могли использовать другой regex для этого:

def num_of_groups(regexp):
    rg = re.compile(r'(?<!\\)\(')
    return len(rg.findall(regexp))

Примечание, что это не работает, если regex содержит негруппы фиксации и также если' (' оставлен при помощи его как' [(]'. Таким образом, это не очень надежно. Но в зависимости от regexes, что Вы используете его, мог бы помочь.

1
ответ дан rslite 27 November 2019 в 07:09
поделиться

Могло бы быть неправильным, но я не думаю, что существует способ найти количество групп, которые были бы возвращены, соответствовали regex. Единственным путем я могу думать для создания этой работы путем, Вы хотите ее к, должен передать количество соответствий, которые Ваш конкретный regex ожидает как аргумент.

Для разъяснения, хотя: Когда findall успешно выполняется, Вы только хотите, чтобы первое соответствие было возвращено, но когда это перестало работать, Вы хотите список пустых строк? Поскольку комментарий, кажется, показывает все соответствия, возвращаемые как список.

0
ответ дан Adam Bellaire 27 November 2019 в 07:09
поделиться

Используя Ваш код как основание:

def groups(regexp, s):
    """ Returns the first result of re.findall, or an empty default

    >>> groups(r'(\d)(\d)(\d)', '123')
    ('1', '2', '3')
    >>> groups(r'(\d)(\d)(\d)', 'abc')
    ('', '', '')
    """
    import re
    m = re.search(regexp, s)
    if m:
        return m.groups()
    return ('',) * len(m.groups())
0
ответ дан Will Boyce 27 November 2019 в 07:09
поделиться
Другие вопросы по тегам:

Похожие вопросы: