Какова вероятность, что первые 4 байта хеша MD5, вычисленного из содержания файла, столкнутся?

Question

Какова вероятность, что первые 4 байта хеша MD5, вычисленного из содержания файла, столкнутся?

Предположим, что Вы создаете CMS для веб-сайта, где Ваши страницы находятся в древовидной структуре, с говорят корень, являющийся домашней страницей.

предположим также Ваш {user|client|customer|boss} запрашивает поместить пройденный путь на каждой странице для показа, где Вы находитесь в дереве.

Для любой данной страницы n, Вы будете, может хотеть приблизиться к родителю n и его родителю, и так далее, рекурсивно создать список узлов назад до корня дерева страницы.

, Конечно, Вы поражаете дб несколько раз на страницу в том примере, таким образом, можно хотеть использовать некоторое искажение SQL, где Вы ищете таблицу страниц как a и таблицу страниц снова как b, и присоединяетесь к a.id с b.parent, таким образом, Вы заставляете базу данных сделать рекурсивные соединения. Это было некоторое время, таким образом, мой синтаксис, вероятно, не полезен.

С другой стороны, можно просто хотеть только вычислить это однажды и снабдить его записью страницы, только обновляя его при перемещении страницы. Это, вероятно, было бы более эффективным.

Так или иначе, это составляет мои.02$

9

hash cryptography md5 combinatorics

задан Marek 13 November 2009 в 08:13

6 ответов

Для идеальной хеш-функции выходные данные распределяются равномерно, поэтому вероятность двух столкновений равна 1 к 2 ^ 32. Парадокс дня рождения, однако, говорит нам, что если мы сравниваем все пары хешей, мы должны ожидать столкновения, когда у нас будет 2 ^ 16 хешей, в среднем, поэтому не полагайтесь только на 4 байта на основании того, что «У меня намного меньше 4 миллиардов значений».

MD5 не является идеальной хеш-функцией, как мы знаем, но слабые стороны здесь несколько случайны: обнаружение коллизии на 4 байтах находится в пределах разумной атака методом грубой силы, поэтому нет необходимости прибегать к криптографическим слабостям. Если вас беспокоят только случайно выбранные данные, вы не увидите значительного статистического отклонения от случайности.

4