рубин на регулярном выражении направляющих для удаления тегов HTML и его содержания из текста

Я хочу регулярное выражение в рубине на направляющих, которые удаляют все теги HTML и его содержание из данного текста.

Например, если моим текстом является:-ВХОД:-

<span id="span_is"><br><br><u><i>Hi</i></u></span> 

затем это должно отобразиться, только ВЫВОД должен быть следующим образом:-

Hi

короче говоря я хочу регулярное выражение или функцию, которые удаляют <> и безотносительно содержания между <>.

С уважением,

Salil Gaikwad

9
задан Harish Shetty 19 March 2010 в 07:51
поделиться

3 ответа

Ваша строка довольно проста, и это решение может работать. Однако изобретать велосипед не стоит. Rails уже включает несколько мощных помощников по очистке .

string = '<span id="span_is"><br><br><u><i>Hi</i></u></span>'
strip_tags(string)
14
ответ дан 4 December 2019 в 07:04
поделиться
'<span id="span_is"><br><br><u><i>Hi</i></u></span>'.gsub(/<\/?[^>]+>/, '')
17
ответ дан 4 December 2019 в 07:04
поделиться

Не делай этого. Пожалуйста.

Хотя ваш входной образец довольно тривиален, вы упомянули, что хотите использовать его в гораздо более широком контексте.

http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html

Для Ruby вы можете попробовать использовать http://hpricot.com / для синтаксического анализа HTML.

1
ответ дан 4 December 2019 в 07:04
поделиться
Другие вопросы по тегам:

Похожие вопросы: