Быстрое расстояние Левенштейна в R?

Незначительная вариация решения @ H1. Вы можете выполнить распределение времени до ggplot:

library(dplyr); library(lubridate)
dat %>%
  mutate(REG_TIME_HOUR = hour(hms(REGISTRATION_TIME))) %>%
  count(REG_TIME_HOUR) %>%
  ggplot(aes(REG_TIME_HOUR, n)) + geom_col()

enter image description here

25
задан smci 1 August 2016 в 21:34
поделиться

2 ответа

levenshteinDist (из пакета RecordLinkage) вызывает скомпилированный C-код. Попробуйте.

18
ответ дан MichaelChirico 28 November 2019 в 21:22
поделиться

Вы можете попробовать stringDist из Biostrings, а также

6
ответ дан MichaelChirico 28 November 2019 в 21:22
поделиться
Другие вопросы по тегам:

Похожие вопросы: