Ruby Nokogiri CSS парсинг HTML

У меня есть некоторые проблемы при попытке заставить код ниже производить данные в формате, который я хочу. Что я, после следующее:

CCC1-5,00$
CCC1-10,00$
CCC1-15,00$
CCC2-7,00$

где 7$ принадлежат CCC2 и другим к CCC1, но мне может только удаться получить данные в этом формате:

CCC1-5,00$
CCC1-10,00$
CCC1-15,00$
CCC1-7,00$
CCC2-5,00$
CCC2-10,00$
CCC2-15,00$
CCC2-7,00$

Любая справка ценилась бы.

require 'rubygems'  
require 'nokogiri'  
require 'open-uri'

doc = Nokogiri::HTML.parse(<<-eohtml)
<div class="AAA">
    <table cellspacing="0" cellpadding="0" border="0" summary="sum">
        <tbody>
            <tr>
                <td class="BBB">
                    <span class="CCC">CCC1</span>
                </td>
                <td class="DDD">
                    <table cellspacing="0" cellpadding="0" border="0">
                        <tbody>
                            <tr><td class="FFF">$5.00</td></tr>
                            <tr><td class="FFF">$10.00</td></tr>
                            <tr><td class="FFF">$15.00</td></tr>
                        </tbody>
                    </table>
                </td>
            </tr>
        </tbody>
    </table>
    <table cellspacing="0" cellpadding="0" border="0" summary="sum">
        <tbody>
            <tr>
                <td class="BBB">
                    <span class="CCC">CCC2</span>
                </td>
                <td class="DDD">
                    <table cellspacing="0" cellpadding="0" border="0">
                         <tbody>
                             <tr><td class="FFF">$7.00</td></tr>
                         </tbody>
                    </table>
                </td>
            </tr>
        </tbody>
    </table>
</div>
eohtml

doc.css('td.BBB > span.CCC').each do |something|
    doc.css('tr > td.EEE,  tr > td.FFF').each do |something_more|
        puts something.content + '-'+ something_more.content
    end
end
5
задан ЯegDwight 18 March 2010 в 15:18
поделиться

1 ответ

Как насчет этого?

doc.css('td.BBB > span.CCC').each do |something|
    something.parent.parent.css('tr > td.EEE,  tr > td.FFF').each do |something_more|
        puts something.content + '-'+ something_more.content
    end
end
4
ответ дан 15 December 2019 в 00:57
поделиться