Я рассмотрел ряд других подобных вопросов, но приведенные методы кажутся слишком медленными для того, что я пытаюсь выполнить, или тестируются на частичные совпадения, которые мне не нужны и должны быть медленнее .
У меня есть два больших файла, заполненных строками, мне нужно проверить каждую строку в одном списке, чтобы увидеть, соответствует ли она какой-либо из строк во втором списке. Мне не нужно проверять частичные совпадения, и все должно быть правильно экранировано.
Второй список (удаляемых строк) содержит 160 000 строк. Я загрузил это в List
, а затем читал каждую строку большего файла и тестировал его с помощью List
.
Даже с небольшой частью первого списка (40 КБ строк) это занимает много времени, вероятно, более 20 минут на моем компьютере для быстрой разработки.
Вот мой вопрос
Есть ли еще / Что есть наиболее эффективный способ сравнения большого списка строк по отдельности с другим большим списком строк, когда частичные совпадения не требуются.