Разбор HTML в perl

Question

Разбор HTML в perl

Я пытаюсь разобрать следующую структуру HTML с помощью perl. Мне нужно выбрать все элементы dd, содержащие сообщение класса, а также идентификатор. Все, что я хотел бы, чтобы сценарий выполнял цикл по всем элементам dd и распечатывал идентификатор элемента dd, но он должен игнорировать первый элемент dd, поскольку он статичен и не изменится.

Это может быть с любой модуль Perl, если он может быть установлен из cpan, чтобы упростить мне задачу. У меня нет большого опыта работы с perl и синтаксическим анализом html, поэтому любые указатели были бы очень полезны.

Спасибо :)

HTML-структура:

<pre><code>
<html>
<head>
</head>
<body>
 .....other elements
    <div id="messages">
        <div class="header"></div>
        <dl>
            <dd class="message unread mc-friend mc-message">This is just a random message, do not parse</dd>
            <dd id="msg2" class="message unread mc-message">
                Hello
            </div>
            <dd id="msg3" class="message unread mc-message">
                Hello
            </dd>
        </dl>
    </div>
</body>
</html>
</pre></code>

13

html perl html-parsing

задан Erik 4 January 2011 в 20:36

0 ответов

Другие вопросы по тегам:

html perl html-parsing

Разбор HTML в perl

0 ответов

Похожие вопросы: