У меня есть набор 200 строк данных (подразумевает маленький набор данных). Я хочу выполнить некоторый статистический анализ, но перед этим я хочу исключить выбросы. Каковы потенциальные алгоритмы для цели?...
Как часть моего рабочего процесса анализа данных, я хочу протестировать на выбросы и затем сделать мое дальнейшее вычисление с и без тех выбросов. Я нашел пакет изолированной части, который имеет различные тесты, но меня'...
У меня есть следующий набор данных, который я пытаюсь вывести на печать с ggplot2, это - временной ряд трех экспериментов A1, B1 и C1, и каждый эксперимент имел три, копирует. Я пытаюсь добавить статистику который...
Я использовал boxplot.stats $ out, чтобы получить выбросы списка в R. Однако я заметил, что часто он не может идентифицировать выбросы. Например: list = c (3,4,7,500) boxplot.stats (список) $ `stats` [1] 3.0 ...
Предположим, я хотел бы отметить и обозначить (с их соответствующими координатами x, y) максимальные, минимальные точки кривой с черной линией и 2 точки, где p = 0,2 пересекает черную линию ...
Я пытаюсь обнаружить аномалии в наборе данных по раку молочной железы, используя Isolation Forest в sklearn. Я пытаюсь применить Iolation Forest к смешанному набору данных, и он дает мне ошибки в значениях, когда я подгоняю модель ....
Итак, во-первых, я знаю, что есть много тем об этом, но все они, похоже, занимаются целым набором данных. Но я хочу, чтобы он применился к определенной переменной, и это создает для меня проблемы ...
У меня есть несколько многомерных данных о красоте и возрастах. Возраст варьируется от 20 до 40 с интервалом 2 (20, 22, 24 .... 40), и для каждой записи данных им дается возраст и оценка красоты от 1 до 5. Когда ...
У меня есть пандас dataframe с несколькими столбцами. Теперь я знаю, что определенные строки являются выбросами на основе определенного значения столбца. Например, столбцы - «Vol» имеет все значения около 12xx, а одно значение - 4000 (...
Я пытаюсь обнаружить выбросы в моем наборе данных и нахожу лес изоляции склеарна. Я не могу понять, как с этим работать. Я вписываю в него свои тренировочные данные, и он возвращает мне вектор с -1 ...
Как настроить ось Y, чтобы игнорировать выбросы, как в этом посте, но в более сложном случае, когда у меня есть 4 блочных диаграммы и " макет "свободная огранка"? p <- ggplot(molten.DF,aes(x=class,...
У меня есть несколько наборов вопросов относительно обнаружения выбросов: можем ли мы найти выбросы с помощью k-средних и является ли это хорошим подходом?
Есть ли какой-либо алгоритм кластеризации, который не принимает никаких входных данных от ...
На этот раз я не буду задавать прямой вопрос о том, как обнаруживать выбросы, как я делал раньше в одном из моих вопросов. Я прочитал некоторые сообщения, связанные с этой темой, но не получил то, что мне было нужно. У меня есть набор ...
Я рисую некоторые данные из различных тестов. Иногда в тесте я получаю один выброс (, скажем, 0,1 ), в то время как все остальные значения на три порядка меньше. С matplotlib я замышляю против...
Функция R boxplot — очень удобный способ просмотра данных: она быстро предоставляет визуальную сводку о приблизительном местоположении и дисперсии ваших данных, а также о количестве выбросов. В ...
Я строю график не -нормального распределения с помощью boxplot и хочу узнать о выбросах с помощью функции boxplot из matplotlib. Помимо графика, мне интересно узнать значение...
У меня возникли трудности с несколькими выбросами, делающими цветовую шкалу бесполезной. Мои данные имеют переменную длины, которая основана на диапазоне, но обычно имеет несколько гораздо больших значений. Пример ниже...
Я анализирую данные от ветряной турбины, обычно это то, что я делал бы в Excel, но количество данных требует чего-то сверхмощного. Я никогда раньше не использовал R, поэтому я просто ...