R
ggplot()
ggplot()
ggplot()
fonctionne par étage.
ggplot()
ggplot()
(suite)La fonction ggplot()
permet de lier des données à une représentation graphique. Elle comprend deux élements obligatoires, data
et mapping = aes()
.
ggplot()
(suite)data =
, on spécifie les données d’où proviennent les variables à visualiser.ggplot()
(suite)aes()
(pour “aesthetic”), on spécifie les éléments visuels. Commençons avec des variables qui prendront place sur l’axe des X et des Y.Dans cet exemple fictif, VariableX
se trouvera sur l’axe des X et VariableY
se trouvera sur l’axe des Y. Ces variables sont dans la banque de données donnees
.
Utilisons les données flights
que nous avons assignées à l’objet dat_echant
.
mapping
consistait simplement à lier des données à un graphique.geom
+
.geom_
, par exemple geom_point()
, geom_line()
, geom_bar()
, geom_histogram()
, geom_boxplot()
, etc.geom
(suite)Nous avons donc un graphique avec le délai de départ sur l’axe des X, et délai d’arrivée sur l’axe des Y.
carrier
(elle se trouve dans l’objet dat_echant
) à l’axe des x d’un graphique. Enregistrez le tout dans un objet nommé p
.p
. Nommez ce nouvel objet p1
.p1
.carrier
(elle se trouve dans l’objet dat_echant
) à l’axe des x d’un graphique. Enregistrez le tout dans un objet nommé p
.p
. Nommez ce nouvel objet p1
.p1
.ggplot()
(suite)Rappelez-vous:
Je voudrais colorer les points en bleu.
ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay, color = "blue")) +
geom_point()
Pourquoi c’est rouge?!
ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay, color = "blue")) +
geom_point()
ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay)) +
geom_point(shape = "triangle")
Remarquez comment j’ai fait tout le graphique “d’un coup” en ajoutant geom_point()
directement à ggplot
.
aes()
sert à faire varier les éléments de la représentation visuelle, comme la couleur, la forme, la taille et l’opacité des éléments qui se trouvent dans le graphique.aes
Encore une fois, rappelez-vous:
aes
(suite)Ici, je veux colorer les points en fonction du mois auquel ils correspondent.
ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay, color = month)) +
geom_point()
aes
(suite)month
est numérique, donc sa couleur prend l’apparence d’un dégradé.ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay,
color = as.factor(month))) +
geom_point()
aes
linetype
), la couleur de remplissage (fill
), l’opacité (alpha
), la taille (size
), la forme des points (shape
), etc.aes
(suite)aes
(suite)Autre exemple.
aes
(suite)ggplot(data = dat_echant,
mapping = aes(x = as.factor(month),
fill = as.factor(origin))) +
geom_bar()
color
et fill
ggplot(data = dat_echant,
mapping = aes(x = as.factor(month), group = origin,
color = as.factor(origin))) +
geom_bar()
dat_echant
, créez un graphique à ligne mettant en relation les variables arr_delay
(y) et dep_delay
(x).red
).month
. Utilisez month
de façon à ce que la variable soit catégorielle.dat_echant
, créez un graphique à ligne mettant en relation les variables arr_delay
(y) et dep_delay
(x).red
).month
. Utilisez month
de façon à ce que la variable soit catégorielle.ggplot(data = dat_echant, aes(x = dep_delay, y = arr_delay,
color = as.factor(month))) +
geom_line()
geom
Il est possible d’ajouter plus d’une géométrie à un graphique.
geom
(suite)ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay)) +
geom_point() +
geom_smooth()
geom
(suite)geom
Avoir plus d’un geom
signifie qu’il est possible de modifier chaque geom
indépendemment l’un de l’autre.
ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay, color = origin)) +
geom_point() +
geom_line()
geom
(suite)ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay)) +
geom_point(mapping = aes(color = origin)) +
geom_line()
geom
(suite)ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay)) +
geom_point() +
geom_line(mapping = aes(color = origin))
dat_echant
, créez un graphique avec la variable dep_delay
sur l’axe des x et la variable arr_delay
sur l’axe des y. Enregistrez le tout dans un objet nommé p
.geom_smooth
) à p
. La forme (shape
) des points doit varier en fonction de la variable origin
. Enregistrez le tout dans un objet nommé p1
. Faites apparaître l’objet p1
.geom_smooth
) à p
. La couleur des lignes doit varier en fonction de la variable origin
. Enregistrez le tout dans un objet nommé p2
. Faites apparaître l’objet p2
.dat_echant
, créez un graphique avec la variable dep_delay
sur l’axe des x et la variable arr_delay
sur l’axe des y. Enregistrez le tout dans un objet nommé p
.geom_smooth
) à p
. La forme (shape
) des points doit varier en fonction de la variable origin
. Enregistrez le tout dans un objet nommé p1
. Faites apparaître l’objet p1
.geom_smooth
) à p
. La couleur des lignes doit varier en fonction de la variable origin
. Enregistrez le tout dans un objet nommé p2
. Faites apparaître l’objet p2
.ggplot
!