Использование групп регулярных выражений Python для извлечения текста из заметок произвольной формы [duplicate]

Question

Использование групп регулярных выражений Python для извлечения текста из заметок произвольной формы [duplicate]

вам понадобится jar-соединитель mysql в вашем пути к классам.

в Java JDBC API делает все с базами данных. используя JDBC, мы можем писать приложения Java в 1. Отправить запросы или обновить SQL до DB (любая реляционная база данных). 2. Извлечь и обработать результаты из DB

с помощью трех шагов, которые мы можем извлечь из любого База данных

Connection con = DriverManager.getConnection(
                     "jdbc:myDriver:DatabaseName",
                     dBuserName,
                     dBuserPassword);

Statement stmt = con.createStatement();
ResultSet rs = stmt.executeQuery("SELECT a, b, c FROM Table");

while (rs.next()) {
    int x = rs.getInt("a");
    String s = rs.getString("b");
    float f = rs.getFloat("c");
}

10

python regex

задан Alan Moore 10 August 2015 в 16:01

2 ответа

Здесь есть две вещи:

re.findall возвращает захваченные тексты, если шаблон регулярного выражения содержит в нем группы захвата
часть r'\\.' в вашем шаблон соответствует двум последовательным символам, \ и любому символу, отличному от новой строки.

См. ссылку findall :

Если одна или несколько групп присутствуют в шаблоне, верните список групп; это будет список кортежей, если шаблон имеет более одной группы. Пустые совпадения включаются в результат, если они не касаются начала другого совпадения.

Обратите внимание, что чтобы re.findall возвращали только совпадающие значения, вы обычно можете

удаляет избыточные группы захвата (например, (a(b)c) -> abc)

преобразует все группы захвата в , не захватывая (то есть замените ( на (?:) , если отсутствуют обратные ссылки, которые относятся к значениям группы в шаблоне (см. ниже)

вместо re.finditer использовать [x.group() for x in re.finditer(pattern, s)])

В вашем случае findall вернул все захваченные тексты, которые были пустыми, потому что вы \\ в [литерале] строки r'', которые пытались сопоставить литерал \.

Чтобы соответствовать номерам, вам нужно использовать
-?\d*\.?\d+
Регулярное выражение соответствует:

-? - Дополнительный знак минус

\d* - Необязательные цифры

\.? - Дополнительный десятичный разделитель

\d+ - 1 или более цифр.

См. demo

Вот демон IDEONE :
import re
s = r'abc123d, hello 3.1415926, this is my book'
pattern = r'-?\d*\.?\d+'
L = re.findall(pattern, s)
print(L)

8

ответ дан Wiktor Stribiżew 28 August 2018 в 16:42

Другие вопросы по тегам:

python regex

Использование групп регулярных выражений Python для извлечения текста из заметок произвольной формы [duplicate]

2 ответа

Похожие вопросы: