Clojure xml библиотека синтаксического анализа для вас.
Парширует и загружает источник s, который может быть файлом, InputStream или String, именовавшим URI. Возвращает дерево структурной карты xml / element, которая имеет ключи: tag,: attrs и: content. и аксессуар fns tag, attrs и контент. Другие синтаксические анализаторы могут быть предоставлены путем передачи startparse, fn, берущего источник и ContentHandler, и возвращения парсера
blockquote>Или используйте enlive , он полностью интегрирован в clojure или использует Java на основе HtmlCleaner .