Подгонка эмпирического распределения к теоретическому с помощью Scipy (Python )?

ВВЕДЕНИЕ : У меня есть список из более чем 30 000 целочисленных значений от 0 до 47 включительно, например [0,0,0,0, .., 1,1, 1,1, ..., 2,2,2,2, ..., 47,47,47, ...] взяты из некоторого непрерывного распределения. Значения в списке не обязательно в порядке, но порядок не имеет значения для этой проблемы.

ПРОБЛЕМА : На основе моего распределения я хотел бы вычислить p-значение (вероятность увидеть большие значения) для любое заданное значение. Например, как вы можете видеть, значение p для 0 будет приближаться к 1, а значение p для более высоких чисел будет стремиться к 0.

Я не знаю, прав ли я, но для определения вероятностей мне нужно чтобы подогнать мои данные к теоретическому распределению, которое лучше всего подходит для описания моих данных. Я предполагаю, что для определения наилучшей модели необходим какой-то тест согласия.

Есть ли способ реализовать такой анализ в Python ( Scipy или Numpy )? Не могли бы вы представить какие-нибудь примеры?

Спасибо!

119
задан Amit Kumar Gupta 21 August 2019 в 04:47
поделиться