Я пытаюсь разобрать следующую структуру HTML с помощью perl. Мне нужно выбрать все элементы dd, содержащие сообщение класса, а также идентификатор. Все, что я хотел бы, чтобы сценарий выполнял цикл по всем элементам dd и распечатывал идентификатор элемента dd, но он должен игнорировать первый элемент dd, поскольку он статичен и не изменится.
Это может быть с любой модуль Perl, если он может быть установлен из cpan, чтобы упростить мне задачу. У меня нет большого опыта работы с perl и синтаксическим анализом html, поэтому любые указатели были бы очень полезны.
Спасибо :)
HTML-структура:
<pre><code>
<html>
<head>
</head>
<body>
.....other elements
<div id="messages">
<div class="header"></div>
<dl>
<dd class="message unread mc-friend mc-message">This is just a random message, do not parse</dd>
<dd id="msg2" class="message unread mc-message">
Hello
</div>
<dd id="msg3" class="message unread mc-message">
Hello
</dd>
</dl>
</div>
</body>
</html>
</pre></code>