Да, на самом деле все будет хорошо. Grep
, и большинство команд Unix работают по потокам по одной строке за раз. Каждая строка, которая выходит из хвоста, будет анализироваться и передаваться, если она соответствует.
Вы можете изменить GlobalRule в свои настройки, чтобы они были специфичны для любого тега-обертки на этой полной странице.
Допустим, у вас есть тег <body>
вокруг вашей структуры:
<body>
<div class="summary-news">
<div class="summary-content">
<h3>Summary</h3>
<ul>
<li> Item 1</li>
<li> Item 2</li>
<li> ... </li>
</ul>
</div>
</div>
<div>
<!-- Other content -->
</div>
<div class="text">
<!-- Main content -->
</div>
</body>
Тогда вам просто нужно изменить свойство article.body
из ваших настроек GlobalRule
, чтобы получить этот контейнер-обертку: [ 117]
{
"class":"GlobalRule",
"selector":"html",
"properties":{
"article.title":{...},
"author.url":{...},
"author.name":{...},
"author.role_contribution" : {...},
"author.description" : {...},
"article.canonical": {...},
"article.publish": {...},
"article.body":{
"selector":"body", // Or whatever selector that grabs your container
"type":"element"
},
"image.url":{...}
}
}
Это должно помочь вам.