ORM: Рукописная схема или автоматически сгенерированный?

Побег с двойной обратной косой чертой

R обрабатывает обратную косую черту как escape-значения для символьных констант . (... и, следовательно, регулярные выражения. Следовательно, необходимо наличие двух обратных косых черт при поставке символьного аргумента для шаблона. Первый - это не символ, а второй - символ). Вы можете видеть как они обрабатываются с помощью cat .

y <- "double quote: \", tab: \t, newline: \n, unicode point: \u20AC"
print(y)
## [1] "double quote: \", tab: \t, newline: \n, unicode point: €"
cat(y)
## double quote: ", tab:    , newline: 
## , unicode point: €

Дальнейшее чтение: Выключение обратной косой черты с обратным слэшем в R вызывает 2 обратных слэша в строке, а не 1

Чтобы использовать специальные символы в регулярном выражении, простейший метод обычно избегает их с обратным слэшем, но, как отмечалось выше, обратная косая черта должна быть экранирована.

grepl("\\[", "a[b")
## [1] TRUE

Чтобы совместить обратную косую черту, вам нужно удвоить бегство, в результате получится четыре обратных косые черты.

grepl("\\\\", c("a\\b", "a\nb"))
## [1]  TRUE FALSE

Пакет rebus содержит константы для каждого из специальных символов, чтобы сэкономить вам чернильные черты.

library(rebus)
OPEN_BRACKET
## [1] "\\["
BACKSLASH
## [1] "\\\\"

Дополнительные примеры см. в:

?SpecialCharacters

. Ваша проблема может быть решена следующим образом:

library(rebus)
grepl(OPEN_BRACKET, "a[b")

Формировать класс символов

Вы также можете обернуть специальные символы в квадрате b ракеты для формирования класса символов .

grepl("[?]", "a?b")
## [1] TRUE

Два специальных символа имеют особое значение внутри классов символов: \ и ^.

Обратная косая черта должен быть экранирован, даже если он находится внутри класса символов.

grepl("[\\\\]", c("a\\b", "a\nb"))
## [1]  TRUE FALSE

Резерв должен быть только экранирован, если он находится непосредственно после квадратной скобки открытия.

grepl("[ ^]", "a^b")  # matches spaces as well.
## [1] TRUE
grepl("[\\^]", "a^b") 
## [1] TRUE

rebus также позволяет вам сформировать класс символов.

char_class("?")
##  [?]

Использовать существующий класс символов

Если вы хотите совместить все знаки препинания, вы можете использовать символ [:punct:] class.

grepl("[[:punct:]]", c("//", "[", "(", "{", "?", "^", "$"))
## [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE

stringi сопоставляет это с общей категорией Unicode для пунктуации, поэтому его поведение немного отличается.

stri_detect_regex(c("//", "[", "(", "{", "?", "^", "$"), "[[:punct:]]")
## [1]  TRUE  TRUE  TRUE  TRUE  TRUE FALSE FALSE

Вы также можете использовать кросс-платформенную синтаксис для доступа к UGC.

stri_detect_regex(c("//", "[", "(", "{", "?", "^", "$"), "\\p{P}")
## [1]  TRUE  TRUE  TRUE  TRUE  TRUE FALSE FALSE

Использовать \ Q \ E escapes

Размещение символов между \\Q и \\E делает механизм регулярного выражения обрабатывать их буквально, а не как регулярные выражения.

grepl("\\Q.\\E", "a.b")
## [1] TRUE

rebus позволяет писать литеральные блоки регулярных выражений.

literal(".")
##  \Q.\E

Не использовать регулярные выражения

Регулярные выражения не всегда являются ответом. Если вы хотите сопоставить фиксированную строку, вы можете сделать это, например:

grepl("[", "a[b", fixed = TRUE)
stringr::str_detect("a[b", fixed("["))
stringi::stri_detect_fixed("a[b", "[")
5
задан Johan Dahlin 26 November 2008 в 14:27
поделиться

4 ответа

Я никогда не иду с ORM-сгенерированной схемой.

Я нахожу, что пути, которыми ORM хочет генерировать схему, часто в общих разногласиях с тем, как я хочу, чтобы моя база данных была структурирована. Кроме того, и я знаю, что это тривиально, схема номенклатуры обычно плоха.

Структура базы данных имеет свои собственные ограничения, что я нахожу, что обычно инструменты автоматической генерации ORM не рассматривают полностью. И если Вы собираетесь быть желанием выполнить отчеты о Вашей базе данных позже (и Вы будете), затем имея хорошую структуру базы данных, и дизайн очень важен.

3
ответ дан 14 December 2019 в 13:51
поделиться

Позвольте своему решению ORM генерировать его, но не просто вслепую использовать его; прочитайте его и проверка работоспособности он.

0
ответ дан 14 December 2019 в 13:51
поделиться

Позвольте ORM генерировать схему, которую он хочет. Затем можно всегда изменять вещи, которые являются слишком медленными или что Вы хотите по-другому. Но это позволяет, Вы, чтобы быстро начать и иметь что-то работающее плюс люди ORM обычно знаете то, что они делают когда дело доходит до генерации схем.

1
ответ дан 14 December 2019 в 13:51
поделиться

См. эту статью Coding Horror и ссылки для обсуждения той миграции, которую необходимо будет в конечном счете сделать. Запланируйте его теперь.

Также посмотрите Martin Fowler на эволюции базы данных; я особенно рекомендую понятие, что поколение данных тестирования является частью установки базы данных. Идея может быть немного слаборазвитой, в котором нет четкого формирования рисунка различных проблем в различных средах, разработке по сравнению с QA по сравнению с производством.

2
ответ дан 14 December 2019 в 13:51
поделиться
Другие вопросы по тегам:

Похожие вопросы: