У меня есть две гистограммы.
int Hist1[10] = {1,4,3,5,2,5,4,6,3,2};
int Hist1[10] = {1,4,3,15,12,15,4,6,3,2};
Распределение Hist1 имеет многомодальный тип;
Распределение Hist2 имеет тип, одномодовый с единственным видным пиком.
Мои вопросы
Спасибо
Сравнение гистограмм (для использования в облачном моделировании).
(Это файл MS .doc.)
Для #2 вы можете вычислить их перекрестную корреляцию (при условии, что сами корзины могут быть отсортированы). Это дало бы вам приблизительную оценку того, что такое «сходство».
Это всего лишь предположения, но я бы попробовал подогнать каждое распределение под гауссово распределение и использовать что-то вроде значения R-квадрат, чтобы определить, является ли распределение унимодальным или нет.
Что касается сходства между двумя распределениями, я бы попробовал провести автокорреляцию и использовать пиковое положительное значение в автокорреляции в качестве меры сходства. Эти идеи довольно грубые, но, надеюсь, они натолкнут вас на некоторые мысли.
Существует множество программных пакетов, которые «подогнать» ваши дистрибутивы под известные вам дискретные дистрибутивы - Minitab, STATA, R и т. Д. Ссылка на подходящие дистрибутивы в R находится здесь . Я бы не советовал программировать это с нуля.
Что касается сравнения распределений, если ни одно из распределений не соответствует известному распределению (Пуассон, Биномиальное и т. Д.), Тогда вам необходимо использовать непараметрические методы, описанные здесь .