, посмотрите ниже код
#!/usr/bin/env python
# coding:utf-8
'''黄哥Python'''
def get_substring_indices(text, s):
result = [i for i in range(len(text)) if text.startswith(s, i)]
return result
if __name__ == '__main__':
text = "How much wood would a wood chuck chuck if a wood chuck could chuck wood?"
s = 'wood'
print get_substring_indices(text, s)
В KNN выход полностью зависит от ближайших соседей, что может быть или не быть хорошим выбором. Также он чувствителен к метрикам расстояния. Больше вы можете найти здесь здесь . И отличная дискуссия о ее метриках расстояний может быть полезной для вас.
С другой стороны, CNN извлекает признаки из входных данных. Которые очень полезны для проведения анализа. И недавний успех в CNN специально wavenet для аудио приложения, я предпочту пойти с CNN.
Редактировать: Учитывая ваш размер данных, CNN не является хорошим вариантом здесь.