Вот моя лучшая попытка. Он обрабатывает форматы выше, но я уверен, что мне не хватает других возможных форматов.
^\d?(?:(?:[\+]?(?:[\d]{1,3}(?:[ ]+|[\-.])))?[(]?(?:[\d]{3})[\-/)]?(?:[ ]+)?)?(?:[a-zA-Z2-9][a-zA-Z0-9 \-.]{6,})(?:(?:[ ]+|[xX]|(i:ext[\.]?)){1,2}(?:[\d]{1,5}))?$
Предположим, переменная v1
с уровнями A, B, C, D. Вы заметили, что только B имеет отношение, и хотите использовать эту информацию в PCA (поэтому вам нужны числовые / количественные переменные).
Вы можете построить переменную v2 <- 1 * (v1 == 'B')
.