Я пробовал использовать гем Sanitize для очистки строки, содержащей HTML-код веб-сайта.
Sanitize
Удаляются только теги