У меня есть набор данных, который содержит следующие переменные и похожие значения:
COBSDATE, CITY, RESPONSE_TIME
2011-11-23 A 1.1
2011-11-23 A 1.5
2011-11-23 A 1.2
2011-11-23 B 2.3
2011-11-23 B 2.1
2011-11-23 B 1.8
2011-11-23 C 1.4
2011-11-23 C 6.1
2011-11-23 A 3.1
2011-11-23 A 1.1
Я успешно создал график, который отображает все значения времени ответа и гладкую геометрию для дальнейшего описания некоторых изменений.
Проблема, с которой я столкнулся, заключается в том, что я хочу получить лучшее представление о сглаженном значении, а в одном из городов часто наблюдаются "выбросы". Я могу контролировать это, добавляя ylim(0,p99) к графику, но это приводит к тому, что сглаживание рассчитывается только для подмножества данных.
Есть ли способ использовать все данные для сглаженного графика и только подмножество для графика джиттера?
Мой код здесь (оба варианта одинаковы, за исключением + ylim(0,20)
:
усеченный -
ggplot(dataRaw, aes(x=COBSDATE, y=RESPONSE_TIME)) +
geom_jitter(colour=alpha("#007DB1", 1/8)) +
geom_smooth(colour="gray30", fill=alpha("gray40",0.5)) +
ylim(0,20) +
facet_wrap(~CITY)
Весь набор данных -
ggplot(dataRaw, aes(x=COBSDATE, y=RESPONSE_TIME)) +
geom_jitter(colour=alpha("#007DB1", 1/8)) +
geom_smooth(colour="gray30", fill=alpha("gray40",0.5)) +
facet_wrap(~CITY)