Я хочу найти индекс n-го вхождения элемента в списке. например,
x=[False,True,True,False,True,False,True,False,False,False,True,False,True]
Каков индекс n-й истины? Если мне нужно пятое вхождение (4-е, если с нулевым индексом), ответ будет 10.
Я придумал:
indargs = [ i for i,a in enumerate(x) if a ]
indargs[n]
Обратите внимание, что x.index
возвращает первое вхождение или первое вхождение. возникновение после некоторой точки, и поэтому, насколько я могу судить, это не решение.
Существует также решение в numpy для случаев, подобных описанным выше, например используя cumsum
и , где
, но я хотел бы знать, есть ли способ решения проблемы без использования numpy.
Меня беспокоит производительность, поскольку я впервые столкнулся с этим, когда реализовал Решето Эратосфена для проблемы Проекта Эйлера , но это более общий вопрос, с которым я сталкивался в других ситуациях.
РЕДАКТИРОВАТЬ: Я получил много отличных ответов, поэтому решил провести несколько тестов производительности. Ниже указано время выполнения timeit
в секундах для списков с элементами len
, которые ищут 4000-ю / 1000-ю Истину. Списки случайные True / False. Исходный код, ссылка на который приведена ниже; это немного грязно. Я использовал короткие / модифицированные версии имен плакатов для описания функций, за исключением listcomp
, который является простым пониманием списка выше.
True Test (100'th True in a list containing True/False)
nelements eyquem_occur eyquem_occurrence graddy taymon listcomp hettinger26 hettinger
3000: 0.007824 0.031117 0.002144 0.007694 0.026908 0.003563 0.003563
10000: 0.018424 0.103049 0.002233 0.018063 0.088245 0.003610 0.003769
50000: 0.078383 0.515265 0.002140 0.078074 0.442630 0.003719 0.003608
100000: 0.152804 1.054196 0.002129 0.152691 0.903827 0.003741 0.003769
200000: 0.303084 2.123534 0.002212 0.301918 1.837870 0.003522 0.003601
True Test (1000'th True in a list containing True/False)
nelements eyquem_occur eyquem_occurrence graddy taymon listcomp hettinger26 hettinger
3000: 0.038461 0.031358 0.024167 0.039277 0.026640 0.035283 0.034482
10000: 0.049063 0.103241 0.024120 0.049383 0.088688 0.035515 0.034700
50000: 0.108860 0.516037 0.023956 0.109546 0.442078 0.035269 0.035373
100000: 0.183568 1.049817 0.024228 0.184406 0.906709 0.035135 0.036027
200000: 0.333501 2.141629 0.024239 0.333908 1.826397 0.034879 0.036551
True Test (20000'th True in a list containing True/False)
nelements eyquem_occur eyquem_occurrence graddy taymon listcomp hettinger26 hettinger
3000: 0.004520 0.004439 0.036853 0.004458 0.026900 0.053460 0.053734
10000: 0.014925 0.014715 0.126084 0.014864 0.088470 0.177792 0.177716
50000: 0.766154 0.515107 0.499068 0.781289 0.443654 0.707134 0.711072
100000: 0.837363 1.051426 0.501842 0.862350 0.903189 0.707552 0.706808
200000: 0.991740 2.124445 0.498408 1.008187 1.839797 0.715844 0.709063
Number Test (750'th 0 in a list containing 0-9)
nelements eyquem_occur eyquem_occurrence graddy taymon listcomp hettinger26 hettinger
3000: 0.026996 0.026887 0.015494 0.030343 0.022417 0.026557 0.026236
10000: 0.037887 0.089267 0.015839 0.040519 0.074941 0.026525 0.027057
50000: 0.097777 0.445236 0.015396 0.101242 0.371496 0.025945 0.026156
100000: 0.173794 0.905993 0.015409 0.176317 0.762155 0.026215 0.026871
200000: 0.324930 1.847375 0.015506 0.327957 1.536012 0.027390 0.026657
Решение itertools от Hettinger почти всегда является лучшим. Решения taymon и graddy являются следующими лучшими для большинства ситуаций, хотя подход с пониманием списка может быть лучше для коротких массивов, когда вам нужен n-й экземпляр, такой что n является высоким, или списки, в которых меньше n вхождений. Если есть вероятность, что вхождений меньше n, начальная проверка count
экономит время. Кроме того, graddy's более эффективен при поиске чисел вместо True / False ... не понятно, почему это так. Решения eyquem по существу эквивалентны другим с чуть более или менее накладными расходами; eyquem_occur примерно то же самое, что и решение taymon, а eyquem_occurrence похоже на listcomp.