Я работаю над проектом, включающим очистку списка данных по специальностям колледжа. Я обнаружил, что многие написаны с ошибками, поэтому я искал использовать функцию gsub ()
, чтобы заменить орфографические ошибки с правильным написанием. Например, слово «биология» неправильно написано в списке специальностей Major. Как я могу заставить R обнаружить орфографическую ошибку и заменить ее правильным написанием? Я пробовал gsub ('biol', 'Biology', Major)
, но это заменяет только первые четыре буквы в 'biolgy'. Если я использую gsub ('biolgy', 'Biology', Major)
, это работает только для этого случая, но не обнаруживает других форм неправильного написания слова «биология».
Спасибо!