Извлечение таблицы HTML с помощью Perl

У меня есть следующая таблица:

<table cellpadding="4" cellspacing="0" border="0">
        <tr>
            <td>
                <span class="label">Label1< /pan> 
            </td>
            <td>
                label1_value1
            </td>
        </tr>
        <tr>
            <td>
                <span class="label">Label2</span> 
            </td>
            <td>
                            Label2_value1 <br/>
                            Label2_value2 <br/>

            </td>
        </tr>

        <tr valign="top">
            <td>
                <span class="label">Label3</span> 
            </td>
            <td>

                Result 1<br/>

                Result 2<br/>
                <span class="related"> - 
                                                     Result 1  SP2<br/> </span>
            </td>
        <\tr>
</table>

Я хочу использовать HTML :: TableExtract для извлечения этой таблицы

Я использую следующий код для извлечения таблицы:

$te->parse($table_content);
foreach my $row ($te->rows) {
    if (defined($row->[1])) {
        $row->[1]=~s/^\s+//gm;
        $row->[1]=~s/\s+$/;/gm;
        print $row->[1],"\n";
    }
}

Мне нужен результат в этом формате:

label1_value1,label1_value1;label1_value2,result1;result2-result3

но я получаю неверные результаты, может ли кто-нибудь помочь в решении проблемы с моим кодом или, если возможно, разобрать промежутки с помощью HTML :: TableExtract

, я получаю следующее: label1_value1 Label2_value1 Label2_value2;

результат1

результат2

-

reuslt1;

0
задан Sinan Ünür 24 July 2011 в 19:37
поделиться