Ищу предложения по представлению данных распределения вероятностей

Я ищу элегантный и эффективный способ представления и хранения произвольного распределения вероятностей, построенного путем явной выборки.

Ожидается, что распределение будет иметь следующие свойства:

  • Выборки представляют собой значения с плавающей запятой, но в принципе можно считать, что они имеют разрешение до .001
  • Выборки взяты из интервала [-4000; 4000]
  • Однако для любых двух выборок a, b, |a - b| < 40
  • В 90% случаев он будет иметь острый пик или несколько острых пиков, близких друг к другу
  • 10% времени, он будет иметь пик с неровным плато шириной от 0,5 до 5.

Обычное представление — массив гистограмм — нежелательно главным образом из-за компромисса между квантованием/разрешением и пространством. Я предполагаю, что должен быть метод представления, который адаптивно изменяет размер ячейки в зависимости от локальной «сложности».

Пространство вызывает беспокойство, потому что структура данных более высокого уровня, похожая на сетку, будет содержать тысячи ячеек, каждая из которых содержит по крайней мере одно такое представление вероятности. Простая сериализация для передачи на диск или по сети желательна, но эффективность не является приоритетом.

Будем признательны за любую помощь.

13
задан George Skoptsov 20 March 2012 в 15:43
поделиться