R Language - Сортировка данных по диапазонам; усреднение; игнорировать выбросы

Я анализирую данные с ветряной турбины, обычно это то, что я делал бы в Excel, но количество данных требует чего-то сверхмощного. Я никогда раньше не использовал R, поэтому я просто ищу несколько указателей.

Данные состоят из 2 столбцов WindSpeed ​​ и Power , пока я пришел к импорту данных из CSV-файла и построили диаграмму рассеяния друг против друга.

Что я хотел бы сделать дальше, так это отсортировать данные по диапазонам; например, все данные, где WindSpeed ​​ находится между x и y, а затем найти среднее значение мощности, генерируемой для каждого диапазона, и построить график кривой.

Из этого среднего я хочу пересчитать среднее значение на основе данных, которые попадают в одно из двух стандартных отклонений от среднего (в основном игнорируя выбросы).

Любые указатели приветствуются.

Для тех, кому интересно, я пытаюсь чтобы создать график, похожий на этот . Это довольно стандартный тип графика, но, как я уже сказал, для сдвига количества данных требуется что-то более тяжелое, чем в Excel.

5
задан klonq 30 January 2011 в 13:35
поделиться