как класс DOMDocument в PHP, там любой класс в Ruby (т.е. базовом Ruby), чтобы проанализировать и получить значение элементов узла из Документа HTML.
Встроенного парсера HTML нет (пока), но есть несколько очень хороших, в частности Nokogiri.
Мета-ответ: Для таких общих нужд, как эти, я бы рекомендовал заглянуть на сайт Ruby Toolbox. Вы заметите, что Nokogiri является верхней рекомендацией для HTML парсеров
Вы должны проверить hpricot. Это чрезвычайно хорошо. Это не «основной» рубин, но это широко используемый драгоценный камень.