«Таким образом, в основном я могу получить все видимые слова на сайте для пользователя без какой-либо уценки HTML.» ✱ ✱ sup> Мои поправки в верхнем регистре и грамматические исправления sup>
blockquote>
Текст можно легко извлечь из HTML просто используя свойства .textContent или .innerText. Существуют некоторые существенные различия между результатами и незначительным несоответствием стандартов, см. Ссылки выше и демонстрацию ниже.
Демонстрация
Запустите демонстрацию и щелкните ссылку Results или прокрутите до самого низа
var content = document.getElementById('content');
var tC = document.getElementById('textContent');
tC.textContent = content.textContent;
var iT = document.getElementById('innerText');
iT.innerText = content.innerText;
Home
Section I
Lorem ipsum dolor sit amet, eos nonumy omittam ex. No dicant tibique accusamus pri, sed omnis posidonium ad. In sea dico honestatis, ex repudiare reprimique delicatissimi mea. Sit dicta moderatius ad, natum convenire usu ei. Est no graece laboramus
deterruisset.
Section II
Mundi nemore iisque in nec. An dolorum intellegat conclusionemque eos, ad labore omittam mel. Te nam wisi omittam patrioque, oporteat honestatis intellegebat cu mei. Odio cibo omittantur te sed.
Section III
Alii commodo ne sea, eu pro legimus signiferumque. At mei nisl facete adolescens, et mel eleifend voluptatibus. Qui ei wisi sonet noster, est solum posidonium scribentur et, sea nobis verear ut. Nemore admodum usu ne.
Article
Lorem ipsum dolor sit amet, quot erroribus voluptatum in pri. Fabulas vocibus insolens his ex. Vide laboramus ius et, at sit adhuc doctus luptatum, et sit dicat inani democritum. His liber blandit pericula id, an fugit reformidans neglegentur
cum. Indoctum intellegat et pro, sed fabulas ocurreret eu. Nam ut fabulas inciderint, iracundia conceptam ne vix, quo offendit inimicus torquatos in.
Ut has elit labores, ex animal delectus efficiendi eos. Id soleat accusamus mel, sint deterruisset his an. Civibus fabellas interpretaris vis ea, dicat aperiri nec ut. Et posidonium dissentias ius, essent quodsi no nam. Mei graece prompta
quaestio et, pri no voluptua atomorum. Pri id putant graecis. Autem prompta nostrud ut mei, mea ut facilisis expetenda intellegebat.
Quo dolor commune albucius ea, ad novum senserit mediocritatem pro, te nisl quidam intellegam nam. Audire omittam in sea, per veniam noster ne. Duo illum assum discere ne, sed cu posse alterum accusam. Cum an error pertinacia, aperiam deleniti
sedcu. Pri ut facilisi hendrerit reformidans, id qui modus libris deseruisse, cum primis moderatius ut.
Я рекомендовал бы смотреть на некоторые научно-исследовательские работы по теме. "Понимание Philip Wadler Монад" и "Монад для функционального программирования" является двумя хорошими стартовыми местами для понимания монад.
Лямбда-исчисление определенно важно, если вы действительно хотите понимать функциональные языки.
Я могу порекомендовать введение Хенка Барендрегта , а также его книгу (полный текст онлайн).