6
ответов

Каковы эффективные и точные алгоритмы для исключения выбросов из ряда данных?

У меня есть набор 200 строк данных (подразумевает маленький набор данных). Я хочу выполнить некоторый статистический анализ, но перед этим я хочу исключить выбросы. Каковы потенциальные алгоритмы для цели?...
вопрос задан: 21 June 2012 10:56
3
ответа

Как использовать Тесты Изолированной части в Коде R

Как часть моего рабочего процесса анализа данных, я хочу протестировать на выбросы и затем сделать мое дальнейшее вычисление с и без тех выбросов. Я нашел пакет изолированной части, который имеет различные тесты, но меня'...
вопрос задан: 10 April 2013 05:40
2
ответа

R: Как удалить выбросы из более гладкого в ggplot2?

У меня есть следующий набор данных, который я пытаюсь вывести на печать с ggplot2, это - временной ряд трех экспериментов A1, B1 и C1, и каждый эксперимент имел три, копирует. Я пытаюсь добавить статистику который...
вопрос задан: 22 July 2019 11:09
2
ответа

Удалить выбросы из определенного столбца

У меня есть датафрейм с именем bids_data bids_data: Supplier_ID shiper_RFQ ---------- 0 2305 5000 1 2309 5200 2 2305 6500 3 2307 4500 4 2301 900 5 2302 ...
вопрос задан: 20 March 2019 07:39
2
ответа

Boxplot.stats R не идентифицирует выбросы

Я использовал boxplot.stats $ out, чтобы получить выбросы списка в R. Однако я заметил, что часто он не может идентифицировать выбросы. Например: list = c (3,4,7,500) boxplot.stats (список) $ `stats` [1] 3.0 ...
вопрос задан: 5 March 2019 15:18
1
ответ

Разметка точек на графике в R

Предположим, я хотел бы отметить и обозначить (с их соответствующими координатами x, y) максимальные, минимальные точки кривой с черной линией и 2 точки, где p = 0,2 пересекает черную линию ...
вопрос задан: 5 March 2019 17:32
1
ответ

Изоляционный лес: категориальные данные

Я пытаюсь обнаружить аномалии в наборе данных по раку молочной железы, используя Isolation Forest в sklearn. Я пытаюсь применить Iolation Forest к смешанному набору данных, и он дает мне ошибки в значениях, когда я подгоняю модель ....
вопрос задан: 26 February 2019 13:05
1
ответ

Удалить 5% процентиля определенной переменной

Итак, во-первых, я знаю, что есть много тем об этом, но все они, похоже, занимаются целым набором данных. Но я хочу, чтобы он применился к определенной переменной, и это создает для меня проблемы ...
вопрос задан: 13 July 2018 14:06
1
ответ

Как удалить выбросы из набора данных

У меня есть несколько многомерных данных о красоте и возрастах. Возраст варьируется от 20 до 40 с интервалом 2 (20, 22, 24 .... 40), и для каждой записи данных им дается возраст и оценка красоты от 1 до 5. Когда ...
вопрос задан: 21 May 2018 06:15
0
ответов

Обнаруживать и исключать выбросы в кадре данных Pandas

У меня есть пандас dataframe с несколькими столбцами. Теперь я знаю, что определенные строки являются выбросами на основе определенного значения столбца. Например, столбцы - «Vol» имеет все значения около 12xx, а одно значение - 4000 (...
вопрос задан: 25 December 2018 00:09
0
ответов

Как использовать Isolation Forest

Я пытаюсь обнаружить выбросы в моем наборе данных и нахожу лес изоляции склеарна. Я не могу понять, как с этим работать. Я вписываю в него свои тренировочные данные, и он возвращает мне вектор с -1 ...
вопрос задан: 25 July 2017 15:04
0
ответов

Игнорировать выбросы в блочной диаграмме ggplot2 + фасетирование + «бесплатные» параметры

Как настроить ось Y, чтобы игнорировать выбросы, как в этом посте, но в более сложном случае, когда у меня есть 4 блочных диаграммы и " макет "свободная огранка"? p <- ggplot(molten.DF,aes(x=class,...
вопрос задан: 23 May 2017 12:01
0
ответов

Обнаружение выбросов при интеллектуальном анализе данных [закрыто]

У меня есть несколько наборов вопросов относительно обнаружения выбросов: можем ли мы найти выбросы с помощью k-средних и является ли это хорошим подходом? Есть ли какой-либо алгоритм кластеризации, который не принимает никаких входных данных от ...
вопрос задан: 10 January 2013 23:17
0
ответов

Обнаружение одномерного выброса

На этот раз я не буду задавать прямой вопрос о том, как обнаруживать выбросы, как я делал раньше в одном из моих вопросов. Я прочитал некоторые сообщения, связанные с этой темой, но не получил то, что мне было нужно. У меня есть набор ...
вопрос задан: 11 November 2012 09:45
0
ответов

matplotlib :игнорировать выбросы при построении графика

Я рисую некоторые данные из различных тестов. Иногда в тесте я получаю один выброс (, скажем, 0,1 ), в то время как все остальные значения на три порядка меньше. С matplotlib я замышляю против...
вопрос задан: 9 August 2012 11:42
0
ответов

Как я могу идентифицировать метки выбросов в блочной диаграмме R?

Функция R boxplot — очень удобный способ просмотра данных: она быстро предоставляет визуальную сводку о приблизительном местоположении и дисперсии ваших данных, а также о количестве выбросов. В ...
вопрос задан: 21 June 2012 08:31
0
ответов

Нахождение точек-выбросов из matplotlib :boxplot

Я строю график не -нормального распределения с помощью boxplot и хочу узнать о выбросах с помощью функции boxplot из matplotlib. Помимо графика, мне интересно узнать значение...
вопрос задан: 20 April 2012 15:17
0
ответов

Цветовая шкала ggplot2 перегружена выбросами

У меня возникли трудности с несколькими выбросами, делающими цветовую шкалу бесполезной. Мои данные имеют переменную длины, которая основана на диапазоне, но обычно имеет несколько гораздо больших значений. Пример ниже...
вопрос задан: 21 March 2012 20:13
0
ответов

R Language - Сортировка данных по диапазонам; усреднение; игнорировать выбросы

Я анализирую данные от ветряной турбины, обычно это то, что я делал бы в Excel, но количество данных требует чего-то сверхмощного. Я никогда раньше не использовал R, поэтому я просто ...
вопрос задан: 30 January 2011 13:35