Среднее значение и стандартное отклонение очень большого набора данных

Мне интересно, существует ли алгоритм, вычисляющий среднее значение и стандартное отклонение несвязанного набора данных.

например, я отслеживаю измеряемое значение, скажем, электрического тока. Я хотел бы иметь среднее значение всех исторических данных. Всякий раз, когда приходит новое значение, обновлять среднее значение и stdev? Поскольку данные слишком велики для хранения, я надеюсь, что он может просто обновлять среднее значение и стандартное отклонение на лету без сохранения данных.

Даже данные сохраняются, стандартный способ (d1+...+dn )/n не работает, сумма испортит представление данных.

I через примерно сумму (d1/n + d2/n +... d3/n ), если n велико, ошибка слишком велика и накапливается. Кроме того, n в этом случае является несвязанным.

Количество данных однозначно не привязано, всякий раз, когда они приходят, требуется обновить значение.

Кто-нибудь знает, есть ли для этого алгоритм?

21
задан Community 22 September 2017 в 17:44
поделиться