La manipulació de cadenes és una habilitat fonamental en la programació amb R, especialment quan es treballa amb dades textuals. En aquest tema, aprendrem a treballar amb cadenes de text utilitzant funcions bàsiques i paquets especialitzats com stringr.
Continguts
Introducció a les Cadenes en R
En R, les cadenes de text es representen com a vectors de caràcters. Podem crear cadenes utilitzant cometes simples o dobles.
Funcions Bàsiques per Manipular Cadenes
Concatenació de Cadenes
La funció paste() i paste0() s'utilitzen per concatenar cadenes.
# Concatenació amb espai
cadena3 <- paste("Hola", "món")
print(cadena3) # "Hola món"
# Concatenació sense espai
cadena4 <- paste0("Hola", "món")
print(cadena4) # "Holamón"Longitud de la Cadena
La funció nchar() retorna la longitud d'una cadena.
Subcadenes
La funció substr() s'utilitza per extreure subcadenes.
Substitució de Text
La funció sub() i gsub() s'utilitzen per substituir text dins d'una cadena.
# Substituir la primera ocurrència
cadena5 <- sub("món", "R", cadena1)
print(cadena5) # "Hola, R!"
# Substituir totes les ocurrències
cadena6 <- gsub("o", "0", cadena1)
print(cadena6) # "H0la, m0n!"Manipulació Avançada amb stringr
El paquet stringr proporciona funcions més avançades i fàcils d'utilitzar per a la manipulació de cadenes.
Instal·lació i Càrrega del Paquet
Funcions Principals de stringr
str_length()
Retorna la longitud de la cadena.
str_sub()
Extreu subcadenes.
str_replace() i str_replace_all()
Substitueix text dins d'una cadena.
# Substituir la primera ocurrència cadena7 <- str_replace(cadena1, "món", "R") print(cadena7) # "Hola, R!" # Substituir totes les ocurrències cadena8 <- str_replace_all(cadena1, "o", "0") print(cadena8) # "H0la, m0n!"
str_c()
Concatena cadenes.
Exercicis Pràctics
- Concatenació de Cadenes: Utilitza
paste()per concatenar les cadenes"Aprendre"i"R"amb un espai entre elles. - Longitud de la Cadena: Troba la longitud de la cadena
"Manipulació de cadenes en R". - Subcadena: Extreu la subcadena
"cadenes"de la cadena"Manipulació de cadenes en R". - Substitució de Text: Substitueix totes les ocurrències de la lletra
"a"per"@"en la cadena"Manipulació de cadenes en R". - Manipulació amb stringr: Utilitza
str_replace_all()per substituir totes les ocurrències de"e"per"3"en la cadena"Manipulació de cadenes en R".
Solucions
- Concatenació de Cadenes
- Longitud de la Cadena
- Subcadena
- Substitució de Text
- Manipulació amb stringr
library(stringr) resultat5 <- str_replace_all(cadena, "e", "3") print(resultat5) # "Manipulació d3 cad3n3s 3n R"
Conclusió
En aquesta secció, hem après a manipular cadenes de text en R utilitzant funcions bàsiques i el paquet stringr. Aquestes habilitats són essencials per treballar amb dades textuals i preparar-les per a anàlisis més avançades. En el següent mòdul, explorarem la visualització de dades, una part crucial per comunicar els resultats de les nostres anàlisis.
Programació en R: De Principiant a Avançat
Mòdul 1: Introducció a R
- Introducció a R i RStudio
- Sintaxi Bàsica de R
- Tipus de Dades i Estructures
- Operacions i Funcions Bàsiques
- Importació i Exportació de Dades
Mòdul 2: Manipulació de Dades
- Vectors i Llistes
- Matrius i Arrays
- Data Frames
- Factors
- Manipulació de Dades amb dplyr
- Manipulació de Cadenes
Mòdul 3: Visualització de Dades
- Introducció a la Visualització de Dades
- Gràfics Base de R
- Conceptes Bàsics de ggplot2
- ggplot2 Avançat
- Visualitzacions Interactives amb plotly
Mòdul 4: Anàlisi Estadística
- Estadístiques Descriptives
- Distribucions de Probabilitat
- Proves d'Hipòtesi
- Correlació i Regressió
- ANOVA i Proves de Chi-Cuadrat
Mòdul 5: Gestió Avançada de Dades
- Gestió de Dates i Hores
- Reestructuració de Dades
- Treballant amb Grans Conjunts de Dades
- Web Scraping
- APIs i JSON
Mòdul 6: Conceptes Avançats de Programació
- Escriure Funcions
- Depuració i Gestió d'Errors
- Programació Orientada a Objectes en R
- Programació Funcional
- Computació Paral·lela
Mòdul 7: Aprenentatge Automàtic amb R
- Introducció a l'Aprenentatge Automàtic
- Preprocessament de Dades
- Aprenentatge Supervisat
- Aprenentatge No Supervisat
- Avaluació i Ajust de Models
Mòdul 8: Temes Especialitzats
- Anàlisi de Sèries Temporals
- Anàlisi de Dades Espacials
- Mineria de Text i Processament del Llenguatge Natural
- Bioinformàtica amb R
- Anàlisi de Dades Financeres
