Introducció
ggplot2 és una de les biblioteques més populars per a la visualització de dades en R. Proporciona una manera coherent i poderosa de crear gràfics complexos de manera senzilla. En aquest tema, aprendrem els conceptes bàsics de ggplot2 i com utilitzar-lo per crear visualitzacions efectives.
Instal·lació i Càrrega de ggplot2
Abans de començar, assegura't de tenir instal·lat ggplot2. Si no el tens, pots instal·lar-lo amb la següent comanda:
Després, carrega la biblioteca:
Estructura Bàsica d'un Gràfic en ggplot2
Un gràfic en ggplot2 es construeix en capes. La funció principal és ggplot(), que crea un objecte gràfic buit. A partir d'aquí, afegim capes utilitzant el símbol +.
Components Principals
- Dades: El conjunt de dades que vols visualitzar.
- Estètica (aes): Defineix com es mapegen les variables de les dades als atributs visuals (com ara l'eix x, l'eix y, el color, etc.).
- Geometria (geom): Defineix el tipus de gràfic (com ara punts, línies, barres, etc.).
Exemple Bàsic
Vegem un exemple bàsic utilitzant el conjunt de dades mtcars:
# Carregar el conjunt de dades mtcars data(mtcars) # Crear un gràfic de dispersió bàsic ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point()
En aquest exemple:
data = mtcars: Especifica el conjunt de dades.aes(x = wt, y = mpg): Defineix que la variablewt(pes) es mapeja a l'eix x impg(milles per galó) a l'eix y.geom_point(): Afegeix una capa de punts (gràfic de dispersió).
Personalització de Gràfics
Afegir Títols i Etiquetes
Pots afegir títols i etiquetes als eixos utilitzant la funció labs():
ggplot(data = mtcars, aes(x = wt, y = mpg)) +
geom_point() +
labs(title = "Relació entre Pes i Milles per Galó",
x = "Pes (1000 lbs)",
y = "Milles per Galó")Canviar l'Aparença dels Punts
Pots personalitzar l'aparença dels punts utilitzant arguments dins de geom_point():
ggplot(data = mtcars, aes(x = wt, y = mpg)) +
geom_point(color = "blue", size = 3, shape = 16) +
labs(title = "Relació entre Pes i Milles per Galó",
x = "Pes (1000 lbs)",
y = "Milles per Galó")Afegir Capes Addicionals
Pots afegir capes addicionals per enriquir el gràfic. Per exemple, afegir una línia de regressió:
ggplot(data = mtcars, aes(x = wt, y = mpg)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE, color = "red") +
labs(title = "Relació entre Pes i Milles per Galó amb Línia de Regressió",
x = "Pes (1000 lbs)",
y = "Milles per Galó")En aquest exemple, geom_smooth(method = "lm", se = FALSE, color = "red") afegeix una línia de regressió lineal (lm) sense la banda d'error (se = FALSE) i de color vermell.
Exercicis Pràctics
Exercici 1: Gràfic de Dispersió amb Personalització
Crea un gràfic de dispersió utilitzant el conjunt de dades mtcars on es mostri la relació entre hp (potència) i mpg (milles per galó). Personalitza els punts perquè siguin de color verd i de mida 4. Afegeix un títol i etiquetes als eixos.
Solució
ggplot(data = mtcars, aes(x = hp, y = mpg)) +
geom_point(color = "green", size = 4) +
labs(title = "Relació entre Potència i Milles per Galó",
x = "Potència (hp)",
y = "Milles per Galó")Exercici 2: Gràfic de Barres
Utilitza el conjunt de dades mtcars per crear un gràfic de barres que mostri el nombre de cotxes per cada nombre de cilindres (cyl). Afegeix un títol i etiquetes als eixos.
Solució
ggplot(data = mtcars, aes(x = factor(cyl))) +
geom_bar(fill = "skyblue") +
labs(title = "Nombre de Cotxes per Nombre de Cilindres",
x = "Nombre de Cilindres",
y = "Nombre de Cotxes")Resum
En aquesta secció, hem après els conceptes bàsics de ggplot2, incloent-hi com crear gràfics de dispersió, personalitzar-los i afegir capes addicionals. També hem vist com crear gràfics de barres. Aquests coneixements bàsics et permetran començar a explorar les capacitats de ggplot2 per a la visualització de dades.
En el següent tema, aprofundirem en les funcionalitats avançades de ggplot2 per crear visualitzacions més complexes i informatives.
Programació en R: De Principiant a Avançat
Mòdul 1: Introducció a R
- Introducció a R i RStudio
- Sintaxi Bàsica de R
- Tipus de Dades i Estructures
- Operacions i Funcions Bàsiques
- Importació i Exportació de Dades
Mòdul 2: Manipulació de Dades
- Vectors i Llistes
- Matrius i Arrays
- Data Frames
- Factors
- Manipulació de Dades amb dplyr
- Manipulació de Cadenes
Mòdul 3: Visualització de Dades
- Introducció a la Visualització de Dades
- Gràfics Base de R
- Conceptes Bàsics de ggplot2
- ggplot2 Avançat
- Visualitzacions Interactives amb plotly
Mòdul 4: Anàlisi Estadística
- Estadístiques Descriptives
- Distribucions de Probabilitat
- Proves d'Hipòtesi
- Correlació i Regressió
- ANOVA i Proves de Chi-Cuadrat
Mòdul 5: Gestió Avançada de Dades
- Gestió de Dates i Hores
- Reestructuració de Dades
- Treballant amb Grans Conjunts de Dades
- Web Scraping
- APIs i JSON
Mòdul 6: Conceptes Avançats de Programació
- Escriure Funcions
- Depuració i Gestió d'Errors
- Programació Orientada a Objectes en R
- Programació Funcional
- Computació Paral·lela
Mòdul 7: Aprenentatge Automàtic amb R
- Introducció a l'Aprenentatge Automàtic
- Preprocessament de Dades
- Aprenentatge Supervisat
- Aprenentatge No Supervisat
- Avaluació i Ajust de Models
Mòdul 8: Temes Especialitzats
- Anàlisi de Sèries Temporals
- Anàlisi de Dades Espacials
- Mineria de Text i Processament del Llenguatge Natural
- Bioinformàtica amb R
- Anàlisi de Dades Financeres
