Соединение фреймов данных без возврата всех соответствующих комбинаций

Question

Соединение фреймов данных без возврата всех соответствующих комбинаций

Здесь есть две вещи:

re.findall возвращает захваченные тексты, если шаблон регулярного выражения содержит в нем группы захвата
часть r'\\.' в вашем шаблон соответствует двум последовательным символам, \ и любому символу, отличному от новой строки.

См. ссылку findall :

Если одна или несколько групп присутствуют в шаблоне, верните список групп; это будет список кортежей, если шаблон имеет более одной группы. Пустые совпадения включаются в результат, если они не касаются начала другого совпадения.
blockquote>
Обратите внимание, что чтобы re.findall возвращали только совпадающие значения, вы обычно можете

удаляет избыточные группы захвата (например, (a(b)c) -> abc)

преобразует все группы захвата в , не захватывая (то есть замените ( на (?:) , если отсутствуют обратные ссылки, которые относятся к значениям группы в шаблоне (см. ниже)

вместо re.finditer использовать [x.group() for x in re.finditer(pattern, s)])

В вашем случае findall вернул все захваченные тексты, которые были пустыми, потому что вы \\ в [литерале] строки r'', которые пытались сопоставить литерал \.

Чтобы соответствовать номерам, вам нужно использовать
-?\d*\.?\d+
Регулярное выражение соответствует:

-? - Дополнительный знак минус

\d* - Необязательные цифры

\.? - Дополнительный десятичный разделитель

\d+ - 1 или более цифр.

См. demo

Вот демон IDEONE :
import re
s = r'abc123d, hello 3.1415926, this is my book'
pattern = r'-?\d*\.?\d+'
L = re.findall(pattern, s)
print(L)

2

r dataframe join dplyr purrr

задан dan 16 January 2019 в 02:57

1 ответ

Другие вопросы по тегам:

r dataframe join dplyr purrr

Соединение фреймов данных без возврата всех соответствующих комбинаций

1 ответ

Похожие вопросы: