python regex [] не работает [дубликат]

Question

python regex [] не работает [дубликат]

Я думаю, что вы используете Express Edition

Попробуйте добавить «\ SQLEXPRESS» к имени вашего сервера

, например. «MY-SERVER \ SQLEXPRESS»

171

python regex

задан martineau 18 January 2017 в 22:34

6 ответов

Самый простой способ

import re txt='this is a paragraph with<[1> in between</[1> and then there are cases ... where the<[99> number ranges from 1-100</[99>. and there are many other lines in the txt files with<[3> such tags </[3>' out = re.sub("(<[^>]+>)", '', txt) print out

12

ответ дан Ezequiel Marquez 18 August 2018 в 18:17
поделиться

1

Действительно ли скобки нужны? Разве это не будет тем же самым регулярным выражением: <[^>]+>? Кстати: я думаю, что ваше регулярное выражение будет слишком много (например, что-то вроде <html>) – winklerrr 17 August 2017 в 14:12

str.replace() фиксирует замены. Вместо этого используйте re.sub() .

27

ответ дан Ignacio Vazquez-Abrams 18 August 2018 в 18:17
поделиться

1

Также стоит отметить, что ваш шаблон должен выглядеть примерно так: & quot; & lt; / {0-1} \ d {1-2} & gt; & quot; или любой другой вариант использования python с выражением regexp. – bdares 14 April 2011 в 05:05

2

Что означают фиксированные замены? – avi 3 July 2015 в 11:35

3

@avi Вероятно, он имел в виду фиксированное замещение слов, а также частичное определение слов через регулярное выражение. – Gunay Anach 11 July 2017 в 08:48

не нужно использовать регулярное выражение (для вашей строки примера)

>>> s 'this is a paragraph with<[1> in between</[1> and then there are cases ... where the<[99> number ranges from 1-100</[99>. \nand there are many other lines in the txt files\nwith<[3> such tags </[3>\n' >>> for w in s.split(">"): ... if "<" in w: ... print w.split("<")[0] ... this is a paragraph with in between and then there are cases ... where the number ranges from 1-100 . and there are many other lines in the txt files with such tags

2

ответ дан kurumi 18 August 2018 в 18:17
поделиться

Я хотел бы сделать это (пояснение в комментариях):

import re # If you need to use the regex more than once it is suggested to compile it. pattern = re.compile(r"</{0,}\[\d+>") # <\/{0,}\[\d+> # # Match the character “<” literally «<» # Match the character “/” literally «\/{0,}» # Between zero and unlimited times, as many times as possible, giving back as needed (greedy) «{0,}» # Match the character “[” literally «\[» # Match a single digit 0..9 «\d+» # Between one and unlimited times, as many times as possible, giving back as needed (greedy) «+» # Match the character “>” literally «>» subject = """this is a paragraph with<[1> in between</[1> and then there are cases ... where the<[99> number ranges from 1-100</[99>. and there are many other lines in the txt files with<[3> such tags </[3>""" result = pattern.sub("", subject) print(result)

Если вы хотите узнать больше о регулярном выражении, я рекомендую прочитать Cookbook по регулярным выражениям Ян Гойваертс и Стивен Левитан.

16

ответ дан Lorenzo Persichetti 18 August 2018 в 18:17
поделиться

1

Вы можете просто использовать * вместо {0,} – HamZa 27 June 2013 в 11:39

2

Я думаю, что {0,} более читабельна. Только вопрос стиля – Lorenzo Persichetti 27 June 2013 в 12:31

3

Из документов python : {0,} совпадает с *, {1,} эквивалентно +, а {0,1} совпадает с ?. Лучше использовать *, + или ?, когда можете, просто потому, что они короче и легче читать. – winklerrr 17 August 2017 в 14:07

заменить метод строковых объектов не принимает регулярные выражения, а только фиксированные строки (см. документацию: http://docs.python.org/2/library/stdtypes.html#str.replace ) .

Вы должны использовать модуль re:

import re newline= re.sub("<\/?\[[0-9]+>", "", line)

4

ответ дан Zac 18 August 2018 в 18:17
поделиться

1

Вы должны использовать \d+ вместо [0-9]+ – winklerrr 17 August 2017 в 14:05

Другие вопросы по тегам:
python regex

Похожие вопросы:

145
Скрытые возможности Python [закрыто] - 23 May 2017 12:34

81
Лучшие способы учить новичка к программе? [закрытый] - 24 November 2011 00:03

60
Как разбить список на куски одинакового размера? - 23 May 2017 11:55

35
Почему изучают Perl, Python, Ruby, если компания использует C++, C# или Java как язык приложения? [закрытый] - 20 May 2010 08:15

34
Распространенные ошибки в Python [дубликат] - 23 May 2017 10:30

33
Есть ли шаблон для телефонных номеров и их префиксов в зависимости от страны? [Дубликат] - 22 March 2017 17:18

33
Важные реверсивные пары leetcode time out [duplicate] - 25 October 2014 10:12

Действительно ли скобки нужны? Разве это не будет тем же самым регулярным выражением: <[^>]+>? Кстати: я думаю, что ваше регулярное выражение будет слишком много (например, что-то вроде <html>) — winklerrr, 17 August 2017 в 14:12
Также стоит отметить, что ваш шаблон должен выглядеть примерно так: & quot; & lt; / {0-1} \ d {1-2} & gt; & quot; или любой другой вариант использования python с выражением regexp. — bdares, 14 April 2011 в 05:05
Что означают фиксированные замены? — avi, 3 July 2015 в 11:35
@avi Вероятно, он имел в виду фиксированное замещение слов, а также частичное определение слов через регулярное выражение. — Gunay Anach, 11 July 2017 в 08:48
Вы можете просто использовать * вместо {0,} — HamZa, 27 June 2013 в 11:39
Я думаю, что {0,} более читабельна. Только вопрос стиля — Lorenzo Persichetti, 27 June 2013 в 12:31
Из документов python : {0,} совпадает с *, {1,} эквивалентно +, а {0,1} совпадает с ?. Лучше использовать *, + или ?, когда можете, просто потому, что они короче и легче читать. — winklerrr, 17 August 2017 в 14:07
Вы должны использовать \d+ вместо [0-9]+ — winklerrr, 17 August 2017 в 14:05

score 347 · Accepted Answer

Этот проверенный фрагмент должен сделать это:

import re
line = re.sub(r"</?\[\d+>", "", line)

Изменить: Вот прокомментированная версия, объясняющая, как это работает:

line = re.sub(r"""
  (?x) # Use free-spacing mode.
  <    # Match a literal '<'
  /?   # Optionally match a '/'
  \[   # Match a literal '['
  \d+  # Match one or more digits
  >    # Match a literal '>'
  """, "", line)

Регулярные выражения fun! Но я бы настоятельно рекомендовал потратить час или два на изучение основ. Для начала вам нужно узнать, какие символы являются особенными: «метасимволы» , которые должны быть экранированы (т. Е. С обратным слэшем, расположенным спереди), и правила различаются внутри и вне классов символов.) отличный онлайн-учебник по адресу: www.regular-expressions.info . Время, которое вы там проводите, будет многократно платить за себя. Happy regexing!

да, это работает! спасибо, но можете ли вы кратко объяснить регулярное выражение? — alvas, 14 April 2011 в 07:39
Также не пренебрегайте Книгой о регулярных выражениях - Освоение регулярных выражений , Джеффри Фридль — pcurry, 14 May 2013 в 06:05
@pcurry - я согласен на 110% - Самая полезная книга, которую я когда-либо читал. — ridgerunner, 14 May 2013 в 06:48