Вы можете использовать pd.Series.isin
.
Для «IN» используйте: something.isin(somewhere)
Или для «NOT IN»: ~something.isin(somewhere)
В качестве обработанного примера:
>>> df
countries
0 US
1 UK
2 Germany
3 China
>>> countries
['UK', 'China']
>>> df.countries.isin(countries)
0 False
1 True
2 False
3 True
Name: countries, dtype: bool
>>> df[df.countries.isin(countries)]
countries
1 UK
3 China
>>> df[~df.countries.isin(countries)]
countries
0 US
2 Germany
Вы могли использовать unoconv для преобразования листа Calc в csv. Но unoconv, кажется, довольно неустойчив, мне не удалось получить его работающий над простые передозировки (calc) файл.
А лучший выбор jodconverter. Это доступно во вселенной, таким образом, можно установить его с помощью apt
. Jodconverter требует экземпляра выполнения openoffice и слушания на порте 8100.
, Чтобы "вручную" преобразовать этот лист
от передозировок до csv:
$ soffice -headless -accept="socket,port=8100;urp;"
$ jodconverter Untitled1.ods Untitled1.csv
получающийся csv будет похож на это:
$ cat Untitled1.csv
"A","B","C","D"
34,68,23,3
34234,68468,34,1
3423,6846,34,34535
, Если Вам не нужна структура таблицы, но просто содержание для индексации целей, смотрите на [1 115] odt2txt. Это, кажется, может обработать файлы передозировок также, но это не сохранит структуру таблицы. Это не требует q soffice выполнение процесса. С листом, показанным выше, Вы получите следующий вывод:
$ odt2txt Untitled1.ods
A
B
C
D
34
23
3
34234
3
34
1
3423
234
34
34535
Уверенный. Это называют, сохраните как CSV и используйте cat
.