Как проверить, что исходный код скопирован из Интернета

Я создаю веб-инструмент, чтобы проверить, взят ли отправленный контент из Интернета или это собственная работа отправителя. Детектор плагиата.

У меня есть идея, что я могу сгенерировать контрольную сумму и использовать ее в качестве ключа для сравнения с другими записями. Однако, если кто-то внес небольшие изменения, такие как включение/удаление комментариев, изменение имени переменной/функции и т. д., тогда контрольная сумма будет другой, поэтому этот подход не сработает.

Любые предложения по лучшему способу?

6
задан Craig Ringer 20 August 2012 в 06:16
поделиться