Получение плотности вероятности данных

Мне нужно проанализировать некоторые данные об Интернет-сеансах для линии DSL. Я хотел посмотреть, как распределяются длительности сеансов. Я решил, что простой способ сделать это - начать с построения графика плотности вероятности продолжительности всех сеансов.

Я загрузил данные в R и использовал функцию density () . Итак, это было что-то вроде этого

plot(density(data$duration), type = "l", col = "blue", main = "Density Plot of Duration",
     xlab = "duration(h)", ylab = "probability density")

. Я новичок в R и подобном анализе. Это было то, что я обнаружил, просмотрев Google. У меня есть сюжет, но остались вопросы. Это правильная функция для того, что я пытаюсь сделать, или есть что-то еще?

На графике я обнаружил, что масштаб оси Y был от 0 до 1,5. Я не понимаю, как это может быть 1,5, разве это не должно быть от 0 до 1?

Кроме того, я хотел бы получить более плавную кривую. Поскольку набор данных действительно велик, линии действительно неровные. Было бы лучше их сгладить, когда я это представляю. Как мне это сделать?

9
задан lmo 4 April 2017 в 12:16
поделиться