Используйте str
и contains
:
In [5]: df['a'].str.contains('-')
Out[5]:
0 True
1 True
2 True
Name: a, dtype: bool
В utf8_general_ci порядок разных сортов a
(a, A, à, ä и т. д.) не различен: все они равны при сортировке, вы можете видеть в связанные с прецедентом, что все они находятся в белых ячейках после буквы A
.
Если вам нужен порядок сортировки, соответствующий конкретному языку, вам нужно выбрать сортировку, соответствующую этому языку, здесь может быть utf8_swedish_ci , где вы можете видеть, что ä
и å
находятся в конце алфавита.
Это связано с тем, что порядок сортировки не совпадает на разных языках , и utf8_general_ci не может выбрать один, а не другой. Например, в utf8_swedish_ci Å
есть до Ä
, а в utf8_icelandic_ci Å
- после Ä
.