Я создаю веб-инструмент, чтобы проверить, взят ли отправленный контент из Интернета или это собственная работа отправителя. Детектор плагиата.
У меня есть идея, что я могу сгенерировать контрольную сумму и использовать ее в качестве ключа для сравнения с другими записями. Однако, если кто-то внес небольшие изменения, такие как включение/удаление комментариев, изменение имени переменной/функции и т. д., тогда контрольная сумма будет другой, поэтому этот подход не сработает.
Любые предложения по лучшему способу?