Я пытаюсь вырезать некоторый текст из очищенного сайта и не знаю, какие функции или библиотеки я могу использовать, чтобы упростить эту задачу:
пример кода, который я запускаю из PhantomJS:
var latest_release = page.evaluate(function () {
// everything inside this function is executed inside our
// headless browser, not PhantomJS.
var links = $('[class="interesting"]');
var releases = {};
for (var i=0; i<links.length; i++) {
releases[links[i].innerHTML] = links[i].getAttribute("href");
}
// its important to take note that page.evaluate needs
// to return simple object, meaning DOM elements won't work.
return JSON.stringify(releases);
});
В классе interesting
есть то, что мне нужно, окруженное новыми строками, вкладками и еще чем-то.
вот он:
{"\n\t\t\t\n\t\t\t\tI_Am_Interesting\n\t\t\t\n\t\t":null,"\n\t\t\t\n\t\t\t\tI_Am_Interesting\n\t\t\t\n\t\t":null,"\n\t\t\t\n\t\t\t\tI_Am_Interesting\n\t\t\t\n\t\t":null}
Я попробовал string.slice("\n");
и ничего не произошло, мне действительно нужен эффективный способ вырезать такие строки, основываясь на его отношении к этим \n'
и \t
Кстати, это был мой сплит-код:
var x = latest_release.split('\n');
Ваше здоровье.