Что подразумевает парадокс Симпсона в тестировании AB?

И вот еще один пример

private static BufferedImage autoCrop(BufferedImage sourceImage) {
    int left = 0;
    int right = 0;
    int top = 0;
    int bottom = 0;
    boolean firstFind = true;
    for (int x = 0; x < sourceImage.getWidth(); x++) {
        for (int y = 0; y < sourceImage.getWidth(); y++) {
            // pixel is not empty
            if (sourceImage.getRGB(x, y) != 0) {

                // we walk from left to right, thus x can be applied as left on first finding
                if (firstFind) {
                    left = x;
                }

                // update right on each finding, because x can grow only
                right = x;

                // on first find apply y as top
                if (firstFind) {
                    top = y;
                } else {
                    // on each further find apply y to top only if a lower has been found
                    top = Math.min(top, y);
                }

                // on first find apply y as bottom
                if (bottom == 0) {
                    bottom = y;
                } else {
                    // on each further find apply y to bottom only if a higher has been found
                    bottom = Math.max(bottom, y);
                }
                firstFind = false;
            }
        }
    }

    return sourceImage.getSubimage(left, top, right - left, bottom - top);
}
11
задан mjv 18 March 2010 в 17:04
поделиться

3 ответа

Немало трудно сказать, не видя точных данных и измерений, которые вы тестируете, но, как правило, выступаете, вы хотите принимать решения на основе несчастья данных. Эта статья из Microsoft дает довольно четкий пример парадокса Симпсона в программных тестирования.

Можете ли вы предоставить чистый пример ваших комбинированных и незастроенных данных и краткого резюме теста?

10
ответ дан 3 December 2019 в 08:04
поделиться

Если A ясно, значительно лучше у индивидуальных тестов A / B, в то время как B лучше всего в совокупности, то основное значение состоит в том, что вы не можете объединить эти данные, которые устанавливают таким образом . А лучше.

Если тестирование получило те же результаты каждый день, вы бы не получили этот четкий результат, даже при различных размерах образцов в день. Так что я думаю, что это дополнительно подразумевает, что что-то изменилось . Это может быть что угодно, хотя. Может быть, что вы тестировали каждый день изменились (возможно, в некоторых очень тонких способах, как скорость сервера). Или, может быть, люди, которых вы тестируете его на измененном (возможно, демографически, возможно, просто с точки зрения их настроения). Это не означает, что ваше тестирование плохое или недействительное. Это просто означает, что вы измеряете то, что движется, и это делает вещи сложными.

И я мог бы быть пронзительным или недопониманием ситуации, но I думать . Это также обязательно верно, что Вы не тестировали A и B одинаковое количество раз . То есть, если в понедельник вы испытали 50 раз и B 50 раз, и во вторник вы испытали 600 раз и B 600 раз, и так далее, и охватываемые B каждый день, затем я не вижу, как вы можете получить Совокупный результат, где B Beats A. Если это верно на вашу настройку теста, она, безусловно, похоже, что вы можете облегчить рассуждать ваши данные.

4
ответ дан 3 December 2019 в 08:04
поделиться

Парадокс Симпсона происходит только тогда, когда размеры вашей группы разные. На самом деле, результаты джезда - средневзвешенное средневзвешенное для результатов каждой группы (и на этом взвешении, парадокс может подняться).

Это на самом деле не вызвано внешними факторами или материалами. Это просто потому, что одна группа намного важнее (потому что имеет больше элементов в группе).

Если вы предоставляете еще несколько информации, мы, вероятно, могли помочь лучше.

1
ответ дан 3 December 2019 в 08:04
поделиться
Другие вопросы по тегам:

Похожие вопросы: