Получите содержание regex и удалите их, эффективно

Question

Получите содержание regex и удалите их, эффективно

Предполагая, что ваш текст ####[space]xxxx, вы можете вытянуть цифры с помощью LEFT() и SEARCH():

=TRIM(LEFT(A1;SEARCH(" ";A1)-1))

7

regex python

задан Gregg Lind 15 October 2008 в 14:05

4 ответа

Что относительно этого:

import re

text = "abcdedfe falijbijie bbbb laifsjelifjl"
matches = []

ab_re = re.compile( "[ab]" )

def verboseTest( m ):
    matches.append( m.group(0) )
    return ''

textWithoutMatches = ab_re.sub( verboseTest, text )

print matches
# ['a', 'b', 'a', 'b', 'b', 'b', 'b', 'b', 'a']
print textWithoutMatches
# cdedfe flijijie  lifsjelifjl

'repl' аргументом функции re.sub может быть функция, таким образом, можно сообщить или сохранить соответствия оттуда и независимо от того, что функциональные возвраты - то, чем заменит 'sub'.

Функция могла легко быть изменена, чтобы сделать намного более также! Проверьте документацию модуля ре относительно docs.python.org для получения дополнительной информации о том, что еще возможно.

4

ответ дан 6 December 2019 в 23:15

Вы могли использовать разделение с получением круглых скобок. Если Вы делаете, то текст всех групп в шаблоне также возвращается как часть получающегося списка (из документа Python).

Таким образом, код был бы

import re
ab_re = re.compile("([ab])")
text="abcdedfe falijbijie bbbb laifsjelifjl"
matches = ab_re.split(text)
# matches = ['', 'a', '', 'b', 'cdedfe f', 'a', 'lij', 'b', 'ijie ', 'b', '', 'b', '', 'b', '', 'b', ' l', 'a', 'ifsjelifjl']

# now extract the matches
Rmatches = []
remaining = []
for i in range(1, len(matches), 2):
    Rmatches.append(matches[i])
# Rmatches = ['a', 'b', 'a', 'b', 'b', 'b', 'b', 'b', 'a']

for i in range(0, len(matches), 2):
    remaining.append(matches[i])
remainingtext = ''.join(remaining)
# remainingtext = 'cdedfe flijijie  lifsjelifjl'

0

ответ дан 6 December 2019 в 23:15

Мой пересмотренный ответ, с помощью re.split (), который делает вещи в одной передаче regex:

import re
text="abcdedfe falijbijie bbbb laifsjelifjl"
ab_re = re.compile("([ab])")
tokens = ab_re.split(text)
non_matches = tokens[0::2]
matches = tokens[1::2]

(редактирование: вот полная функциональная версия),

def split_matches(text,compiled_re):
    ''' given  a compiled re, split a text 
    into matching and nonmatching sections
    returns m, n_m, two lists
    '''
    tokens = compiled_re.split(text)
    matches = tokens[1::2]
    non_matches = tokens[0::2]
    return matches,non_matches

m,nm = split_matches(text,ab_re)
''.join(nm) # equivalent to ab_re.sub('',text)

3

ответ дан 6 December 2019 в 23:15

Другие вопросы по тегам:

regex python

Получите содержание regex и удалите их, эффективно

4 ответа

Похожие вопросы: