Как я могу найти повторенные буквы с Perl regex?

Когда вы объявляете ссылочную переменную (т. е. объект), вы действительно создаете указатель на объект. Рассмотрим следующий код, в котором вы объявляете переменную примитивного типа int:

int x;
x = 10;

В этом примере переменная x является int, и Java инициализирует ее для 0. Когда вы назначаете его 10 во второй строке, ваше значение 10 записывается в ячейку памяти, на которую указывает x.

Но когда вы пытаетесь объявить ссылочный тип, произойдет что-то другое. Возьмите следующий код:

Integer num;
num = new Integer(10);

Первая строка объявляет переменную с именем num, но она не содержит примитивного значения. Вместо этого он содержит указатель (потому что тип Integer является ссылочным типом). Поскольку вы еще не указали, что указать на Java, он устанавливает значение null, что означает «Я ничего не указываю».

Во второй строке ключевое слово new используется для создания экземпляра (или создания ) объекту типа Integer и переменной указателя num присваивается этот объект. Теперь вы можете ссылаться на объект, используя оператор разыменования . (точка).

Exception, о котором вы просили, возникает, когда вы объявляете переменную, но не создавали объект. Если вы попытаетесь разыменовать num. Перед созданием объекта вы получите NullPointerException. В самых тривиальных случаях компилятор поймает проблему и сообщит вам, что «num не может быть инициализирован», но иногда вы пишете код, который непосредственно не создает объект.

Например, вы можете имеют следующий метод:

public void doSomething(SomeObject obj) {
   //do something to obj
}

В этом случае вы не создаете объект obj, скорее предполагая, что он был создан до вызова метода doSomething. К сожалению, этот метод можно вызвать следующим образом:

doSomething(null);

В этом случае obj имеет значение null. Если метод предназначен для того, чтобы что-то сделать для переданного объекта, целесообразно бросить NullPointerException, потому что это ошибка программиста, и программисту понадобится эта информация для целей отладки.

Альтернативно, там могут быть случаи, когда цель метода заключается не только в том, чтобы работать с переданным в объекте, и поэтому нулевой параметр может быть приемлемым. В этом случае вам нужно будет проверить нулевой параметр и вести себя по-другому. Вы также должны объяснить это в документации. Например, doSomething может быть записано как:

/**
  * @param obj An optional foo for ____. May be null, in which case 
  *  the result will be ____.
  */
public void doSomething(SomeObject obj) {
    if(obj != null) {
       //do something
    } else {
       //do something else
    }
}

Наконец, Как определить исключение & amp; причина использования Трассировки стека

23
задан user000001 23 September 2013 в 07:25
поделиться

9 ответов

Можно найти любую букву, затем использовать \1 для нахождения той же самой буквы вторым разом (или больше). Если только необходимо знать букву, то $1 будет содержать его. Иначе можно связать второе соответствие на первое.

my $str = "Foooooobar";

$str =~ /(\w)(\1+)/;

print $1;
# prints 'o'
print $1 . $2;
# prints 'oooooo'
53
ответ дан Adam Bellaire 29 November 2019 в 00:41
поделиться

Я думаю, что Вы на самом деле хотите это, а не "\w", поскольку это включает числа и подчеркивание.

([a-zA-Z])\1+

хорошо, хорошо, я могу понять намек Leon. Используйте это для unicode-мира или для материала posix.

([[:alpha:]])\1+
14
ответ дан Keng 29 November 2019 в 00:41
поделиться

Я Думаю с помощью обратной ссылки, работал бы:

(\w)\1+

\w в основном [a-zA-Z_0-9] поэтому, если Вы только хотите соответствовать буквам между A и Z (нечувствительно к регистру), используйте [a-zA-Z] вместо этого.

(РЕДАКТИРОВАНИЕ: или, как Tanktalus, упомянутый в его комментарии (и поскольку другие ответили также), [[:alpha:]] , который чувствителен к локали)

9
ответ дан hasseg 29 November 2019 в 00:41
поделиться

Используйте \N, чтобы относиться к предыдущим группам:

/(\w)\1+/g
6
ответ дан Jonathan Lonowski 29 November 2019 в 00:41
поделиться

Следующий код возвратит все символы, который когда-либо повторение дважды или больше.

мой $str = "SSSannnkaaarsss";

$str печати = ~ / (\w) \1 г;

3
ответ дан 29 November 2019 в 00:41
поделиться

К вашему сведению, кроме RegExBuddy, реальный удобный бесплатный сайт для тестирования регулярных выражений RegExr по gskinner.com . Дескрипторы ([[:alpha:]])(\1+) приятно.

1
ответ дан b w 29 November 2019 в 00:41
поделиться

Как насчет:

(\w)\1+

первая часть делает группу без имени вокруг символа, тогда обратная ссылка ищет тот же самый символ.

0
ответ дан Joseph Pecoraro 29 November 2019 в 00:41
поделиться

Вы могли бы хотеть заботиться относительно того, что считается буквой, и это зависит от Вашей локали. Используя латынь ISO 1 позволит акцентируемым Западным символам языка быть согласованными как буквы. В следующей программе локаль по умолчанию не распознает, что é, и таким образом créé не удается соответствовать. Не прокомментируйте код установки локали, и затем он начинает соответствовать.

Также обратите внимание, что \w включает цифры и символ подчеркивания наряду со всеми буквами. Для получения просто букв необходимо взять дополнение non-alphanum, цифр и символов подчеркивания. Это оставляет только буквы.

Это могло бы быть легче понять путем структурирования его как вопроса, "Какое регулярное выражение соответствует какой-либо цифре кроме 3?", и ответ / [^\\D3]/.

#! /usr/local/bin/perl

use strict;
use warnings;

# uncomment the following three lines:
# use locale;
# use POSIX;
# setlocale(LC_CTYPE, 'fr_FR.ISO8859-1');

while (<DATA>) {
    chomp;
    if (/([^\W_0-9])\1+/) {
        print "$_: dup [$1]\n";
    }
    else {
        print "$_: nope\n";
    }
}

__DATA__
100
food
créé
a::b
4
ответ дан 29 November 2019 в 00:41
поделиться

Только для ударов, совершенно другого подхода:

if ( ($str ^ substr($str,1) ) =~ /\0+/ ) {
    print "found ", substr($str, $-[0], $+[0]-$-[0]+1), " at offset ", $-[0];
}
2
ответ дан 29 November 2019 в 00:41
поделиться
Другие вопросы по тегам:

Похожие вопросы: