Незначительная вариация решения @ H1. Вы можете выполнить распределение времени до ggplot:
library(dplyr); library(lubridate)
dat %>%
mutate(REG_TIME_HOUR = hour(hms(REGISTRATION_TIME))) %>%
count(REG_TIME_HOUR) %>%
ggplot(aes(REG_TIME_HOUR, n)) + geom_col()
levenshteinDist (из пакета RecordLinkage
) вызывает скомпилированный C-код. Попробуйте.
Вы можете попробовать stringDist
из Biostrings
, а также