Rggplot()ggplot()ggplot() fonctionne par étage.
ggplot()ggplot() (suite)La fonction ggplot() permet de lier des données à une représentation graphique. Elle comprend deux élements obligatoires, data et mapping = aes().
ggplot() (suite)data =, on spécifie les données d’où proviennent les variables à visualiser.ggplot() (suite)aes() (pour “aesthetic”), on spécifie les éléments visuels. Commençons avec des variables qui prendront place sur l’axe des X et des Y.Dans cet exemple fictif, VariableX se trouvera sur l’axe des X et VariableY se trouvera sur l’axe des Y. Ces variables sont dans la banque de données donnees.
Utilisons les données flights que nous avons assignées à l’objet dat_echant.
mapping consistait simplement à lier des données à un graphique.geom+.geom_, par exemple geom_point(), geom_line(), geom_bar(), geom_histogram(), geom_boxplot(), etc.geom (suite)Nous avons donc un graphique avec le délai de départ sur l’axe des X, et délai d’arrivée sur l’axe des Y.
carrier (elle se trouve dans l’objet dat_echant) à l’axe des x d’un graphique. Enregistrez le tout dans un objet nommé p.p. Nommez ce nouvel objet p1.p1.carrier (elle se trouve dans l’objet dat_echant) à l’axe des x d’un graphique. Enregistrez le tout dans un objet nommé p.p. Nommez ce nouvel objet p1.p1.ggplot() (suite)Rappelez-vous:
Je voudrais colorer les points en bleu.
ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay, color = "blue")) +
geom_point()Pourquoi c’est rouge?!
ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay, color = "blue")) +
geom_point()ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay)) +
geom_point(shape = "triangle")Remarquez comment j’ai fait tout le graphique “d’un coup” en ajoutant geom_point() directement à ggplot.
aes() sert à faire varier les éléments de la représentation visuelle, comme la couleur, la forme, la taille et l’opacité des éléments qui se trouvent dans le graphique.aesEncore une fois, rappelez-vous:
aes (suite)Ici, je veux colorer les points en fonction du mois auquel ils correspondent.
ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay, color = month)) +
geom_point()aes (suite)month est numérique, donc sa couleur prend l’apparence d’un dégradé.ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay,
color = as.factor(month))) +
geom_point()aeslinetype), la couleur de remplissage (fill), l’opacité (alpha), la taille (size), la forme des points (shape), etc.aes (suite)aes (suite)Autre exemple.
aes (suite)ggplot(data = dat_echant,
mapping = aes(x = as.factor(month),
fill = as.factor(origin))) +
geom_bar()color et fillggplot(data = dat_echant,
mapping = aes(x = as.factor(month), group = origin,
color = as.factor(origin))) +
geom_bar()dat_echant, créez un graphique à ligne mettant en relation les variables arr_delay (y) et dep_delay (x).red).month. Utilisez month de façon à ce que la variable soit catégorielle.dat_echant, créez un graphique à ligne mettant en relation les variables arr_delay (y) et dep_delay (x).red).month. Utilisez month de façon à ce que la variable soit catégorielle.ggplot(data = dat_echant, aes(x = dep_delay, y = arr_delay,
color = as.factor(month))) +
geom_line()geomIl est possible d’ajouter plus d’une géométrie à un graphique.
geom (suite)ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay)) +
geom_point() +
geom_smooth()geom (suite)geomAvoir plus d’un geom signifie qu’il est possible de modifier chaque geom indépendemment l’un de l’autre.
ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay, color = origin)) +
geom_point() +
geom_line()geom (suite)ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay)) +
geom_point(mapping = aes(color = origin)) +
geom_line()geom (suite)ggplot(data = dat_echant,
mapping = aes(x = dep_delay, y = arr_delay)) +
geom_point() +
geom_line(mapping = aes(color = origin))dat_echant, créez un graphique avec la variable dep_delay sur l’axe des x et la variable arr_delay sur l’axe des y. Enregistrez le tout dans un objet nommé p.geom_smooth) à p. La forme (shape) des points doit varier en fonction de la variable origin. Enregistrez le tout dans un objet nommé p1. Faites apparaître l’objet p1.geom_smooth) à p. La couleur des lignes doit varier en fonction de la variable origin. Enregistrez le tout dans un objet nommé p2. Faites apparaître l’objet p2.dat_echant, créez un graphique avec la variable dep_delay sur l’axe des x et la variable arr_delay sur l’axe des y. Enregistrez le tout dans un objet nommé p.geom_smooth) à p. La forme (shape) des points doit varier en fonction de la variable origin. Enregistrez le tout dans un objet nommé p1. Faites apparaître l’objet p1.geom_smooth) à p. La couleur des lignes doit varier en fonction de la variable origin. Enregistrez le tout dans un objet nommé p2. Faites apparaître l’objet p2.ggplot!