Enlive - отличный инструмент для этого. Короче:
(ns foo.bar
(:require [net.cgrand.enlive-html :as html]))
(defn fetch-page [url]
(html/html-resource (java.net.URL. url)))
Здесь - хороший учебник по использованию его как скребка / парсера, так и в качестве механизма шаблона:
Здесь - короткий пример соскабливания страницы.
Другой вариант - clj-tagsoup . Enlive также использует tagoup, но, кроме того, имеет подключаемый парсер, поэтому вы можете добавить поддержку для других парсеров.