Моделирование распределения измерений производительности

Из того, что я читаю, это кажется на использование Visual Studio для процесса сборки. Вы думали об использовании MSBuild и Nant вместо этого?

синтаксис XML Nant является немного странным, но как только Вы понимаете его, делая то, что Вы упомянули, становится довольно тривиальным.


    

    
        
    

    
        
    

    
        
    


18
задан peterchen 26 March 2010 в 06:57
поделиться

5 ответов

Попробуйте использовать гамма-распределение http: // en.wikipedia.org/wiki/Gamma_distribution

Из википедии

Гамма-распределение часто является вероятностной моделью для времени ожидания ; например, при тестировании жизни время ожидания смерти является случайной величиной, которая часто моделируется с помощью гамма-распределения.

1
ответ дан 30 November 2019 в 09:28
поделиться

Стандарт для рандомизированного времени прибытия для моделирования производительности - это либо экспоненциальное распределение, либо распределение Пуассона (которое является просто распределением нескольких сложенных экспоненциальных распределений).

0
ответ дан 30 November 2019 в 09:28
поделиться

Часто, когда у вас есть случайное значение, которое может быть только положительным, логнормальное распределение является хорошим способом его моделирования. То есть вы берете журнал каждого измерения и предполагаете, что оно имеет нормальное распределение.

Если вы хотите, вы можете считать, что это имеет несколько горбов, то есть сумму двух нормалей, имеющих разные средние значения. Это немного сложно оценить параметры, потому что вам, возможно, придется оценить для каждого измерения его вероятность принадлежности к каждому горбу. Это может быть больше, чем вы хотите беспокоиться.

Логнормальные распределения очень удобны и хорошо работают. Например, вы не имеете дело с его средним значением, вы имеете дело с его средним геометрическим, которое совпадает с его медианой.

Кстати, в фармакометрическом моделировании логнормальное распределение является повсеместным, моделируя такие вещи, как объем крови, скорости абсорбции и выведения, масса тела и т. д.

ДОБАВЛЕНО: Если вы хотите то, что вы называете плавающим распределением, это называется эмпирическим или непараметрическим распределением. Чтобы смоделировать это, обычно вы сохраняете измерения в отсортированном массиве. Тогда легко определить процентили. Например, медиана - это «среднее число». Если у вас слишком много измерений для сохранения, вы можете перейти к некоторому типу биннинга после того, как у вас будет достаточно измерений, чтобы получить общую форму.

ДОБАВЛЕНО: есть простой способ определить, является ли распределение нормальным (или логарифмически нормальным) . Возьмите журналы измерений и сложите их в отсортированный массив. Затем сгенерируйте график QQ (квантиль-квантиль). Для этого сгенерируйте столько нормальных случайных чисел, сколько у вас есть образцов, и отсортируйте их. Затем просто нанесите точки, где X - точка нормального распределения, а Y - точка логарифмической выборки. В результате должна получиться прямая линия. (Очень простой способ сгенерировать нормальное случайное число - просто сложить 12 однородных случайных чисел в диапазоне +/- 0,5.)

6
ответ дан 30 November 2019 в 09:28
поделиться

Не совсем отвечаю на ваш вопрос, но все же актуальный: Мор Харчол-Балтер провел очень хороший анализ размера заданий, отправляемых планировщику, Влияние распределений размеров заданий с тяжелыми хвостами на проектирование компьютерных систем (1999) . Она обнаружила, что размер заданий, представленных в ее распределенной системе назначения задач, имеет степенное распределение, что означает, что определенные элементы общепринятого мнения, которые она использовала при построении своей системы назначения задач, наиболее важно, что задания должны быть хорошо загружены. сбалансированный, имел ужасные последствия для подателей вакансий. Она проделала хорошую работу по этому вопросу.

В более широком смысле, вам нужно задать такие вопросы, как:

  1. Что произойдет, если кажущиеся разумными предположения о распределении производительности, например, что они принимают нормальное распределение, не выдержат?
  2. Являются ли данные Наборы, на которые я смотрю, действительно представляют проблему, которую я пытаюсь решить?
0
ответ дан 30 November 2019 в 09:28
поделиться

Проблема, которую вы описываете, называется "Подгонка распределения" и не имеет никакого отношения к измерениям производительности, т.е. это общая проблема подгонки подходящего распределения к любой собранной/измеренной выборке данных.

Стандартный процесс выглядит примерно так:

  1. Угадать наилучшее распределение.
  2. Провести проверку гипотез, чтобы проверить, насколько хорошо оно описывает собранные данные.
  3. Повторите 1-3, если оно недостаточно хорошо.

Вы можете найти интересную статью, описывающую, как это можно сделать с помощью программного комплекса с открытым исходным кодом R здесь . Думаю, особенно полезной для вас может оказаться функция fitdistr.

3
ответ дан 30 November 2019 в 09:28
поделиться
Другие вопросы по тегам:

Похожие вопросы: