Какой алгоритм хеширования можно использовать для проверки дублированного содержимого?

У меня есть xml-файл, в котором мне нужно определить, является ли он дубликатом или нет .

Я буду либо хешировать весь XML-файл, либо определенные XML-узлы в XML-файле будут использоваться для генерации какого-либо хеша.

Подходит ли для этого md5?

Или что-то еще? Скорость генерации хэша также довольно важна, но гарантия создания уникального хэша для уникальных данных важнее.

9
задан codecompleting 24 November 2011 в 19:31
поделиться