Ожидаемое количество хеш-коллизий

Мне кажется, что я слишком сильно задумываюсь над этой проблемой, но все равно ...

У меня есть хеш-таблица с M слотами во внутреннем массиве. Мне нужно вставить N элементов в хеш-таблицу. Предполагая, что у меня есть хеш-функция, которая случайным образом вставляет элемент в слот с равной вероятностью для каждого слота, каково ожидаемое значение от общего количества хеш-коллизий?

(Извините, это скорее математический вопрос, чем программирование вопрос).

Изменить: Вот код, который я должен смоделировать с помощью Python. Я получаю числовые ответы, но не могу обобщить их до формулы и объяснить.

import random
import pdb

N = 5
M = 8

NUM_ITER = 100000

def get_collisions(table):
    col = 0
    for item in table:
        if item > 1:
            col += (item-1)
    return col

def run():
    table = [0 for x in range(M)]

    for i in range(N):
        table[int(random.random() * M)] += 1

    #print table
    return get_collisions(table)

# Main

total = 0
for i in range(NUM_ITER):
    total += run()

print float(total)/NUM_ITER
11
задан Brian Tompsett - 汤莱恩 22 October 2016 в 11:38
поделиться