Удаление динамически сгенерированной таблицы HTML без идентификатора и класса с BeautifulSoup

Мне было легче:

1) создать функцию, которая будет проверять, находится ли элемент где-либо в родительской иерархии другого. Что-то вроде этого (я не буду писать функцию, сделаю ее с WHILE DO):

is_related(id, parent_id);

в вашем примере

is_related(21, 19) == 1;
is_related(20, 19) == 1;
is_related(21, 18) == 0;

2) используйте подвыбор, что-то например:

select ...
from table t
join table pt on pt.id in (select i.id from table i where is_related(t.id,i.id));
1
задан Tanvir Khan 3 March 2019 в 17:25
поделиться

1 ответ

Вы, вероятно, должны использовать панды для этого. Что-то вроде:

my_table = """
  [the code from your question]
 """

import pandas as pd

pad_table = pd.read_html(my_table)
pad_table

Это должно помочь вам в этом.

0
ответ дан Jack Fleeting 3 March 2019 в 17:25
поделиться
Другие вопросы по тегам:

Похожие вопросы: