Els mètodes no paramètrics són tècniques estadístiques que no assumeixen una distribució específica per a les dades. Aquests mètodes són útils quan les dades no compleixen les assumpcions necessàries per als mètodes paramètrics, com la normalitat o la homogeneïtat de variàncies. En aquest tema, explorarem els conceptes clau, exemples i exercicis pràctics relacionats amb els mètodes no paramètrics.
Conceptes Clau
-
Definició de Mètodes No Paramètrics:
- Mètodes estadístics que no requereixen assumpcions sobre la distribució de les dades.
- Són útils per a dades ordinals, categòriques o quan les dades no compleixen les assumpcions de normalitat.
-
Avantatges dels Mètodes No Paramètrics:
- Flexibilitat en l'anàlisi de dades.
- Menys sensibles a valors atípics.
- Aplicables a petites mostres.
-
Desavantatges dels Mètodes No Paramètrics:
- Menys potència estadística en comparació amb els mètodes paramètrics.
- Pot ser més difícil d'interpretar.
Principals Mètodes No Paramètrics
- Prova de Mann-Whitney U
- Objectiu: Comparar dues mostres independents per determinar si provenen de la mateixa distribució.
- Assumpcions:
- Les mostres són independents.
- Les dades són ordinals o contínues.
Exemple de Codi en Python:
import scipy.stats as stats
# Dades de dues mostres independents
mostra1 = [12, 15, 14, 10, 13]
mostra2 = [18, 20, 17, 19, 21]
# Realitzar la prova de Mann-Whitney U
resultat = stats.mannwhitneyu(mostra1, mostra2)
print(f'Estadístic U: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')
- Prova de Wilcoxon
- Objectiu: Comparar dues mostres relacionades o aparellades.
- Assumpcions:
- Les mostres són aparellades.
- Les dades són ordinals o contínues.
Exemple de Codi en Python:
import scipy.stats as stats
# Dades de dues mostres aparellades
mostra1 = [12, 15, 14, 10, 13]
mostra2 = [14, 16, 15, 11, 14]
# Realitzar la prova de Wilcoxon
resultat = stats.wilcoxon(mostra1, mostra2)
print(f'Estadístic T: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')
- Prova de Kruskal-Wallis
- Objectiu: Comparar més de dues mostres independents.
- Assumpcions:
- Les mostres són independents.
- Les dades són ordinals o contínues.
Exemple de Codi en Python:
import scipy.stats as stats
# Dades de tres mostres independents
mostra1 = [12, 15, 14, 10, 13]
mostra2 = [18, 20, 17, 19, 21]
mostra3 = [22, 25, 24, 23, 26]
# Realitzar la prova de Kruskal-Wallis
resultat = stats.kruskal(mostra1, mostra2, mostra3)
print(f'Estadístic H: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')
- Prova de Chi-quadrat
- Objectiu: Provar la independència entre dues variables categòriques.
- Assumpcions:
- Les dades són categòriques.
- Les mostres són independents.
Exemple de Codi en Python:
import scipy.stats as stats
# Taula de contingència
taula = [[10, 20, 30], [6, 9, 17]]
# Realitzar la prova de Chi-quadrat
resultat = stats.chi2_contingency(taula)
print(f'Estadístic Chi-quadrat: {resultat[0]}')
print(f'P-valor: {resultat[1]}')
print(f'Graus de llibertat: {resultat[2]}')
print(f'Esperats: {resultat[3]}')Exercicis Pràctics
Exercici 1: Prova de Mann-Whitney U
Comparar les següents dues mostres independents utilitzant la prova de Mann-Whitney U:
- Mostra 1: [23, 45, 67, 34, 22]
- Mostra 2: [56, 78, 45, 89, 67]
Solució:
import scipy.stats as stats
mostra1 = [23, 45, 67, 34, 22]
mostra2 = [56, 78, 45, 89, 67]
resultat = stats.mannwhitneyu(mostra1, mostra2)
print(f'Estadístic U: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')Exercici 2: Prova de Wilcoxon
Comparar les següents dues mostres aparellades utilitzant la prova de Wilcoxon:
- Mostra 1: [12, 14, 16, 18, 20]
- Mostra 2: [11, 15, 17, 19, 21]
Solució:
import scipy.stats as stats
mostra1 = [12, 14, 16, 18, 20]
mostra2 = [11, 15, 17, 19, 21]
resultat = stats.wilcoxon(mostra1, mostra2)
print(f'Estadístic T: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')Exercici 3: Prova de Kruskal-Wallis
Comparar les següents tres mostres independents utilitzant la prova de Kruskal-Wallis:
- Mostra 1: [10, 20, 30, 40, 50]
- Mostra 2: [15, 25, 35, 45, 55]
- Mostra 3: [12, 22, 32, 42, 52]
Solució:
import scipy.stats as stats
mostra1 = [10, 20, 30, 40, 50]
mostra2 = [15, 25, 35, 45, 55]
mostra3 = [12, 22, 32, 42, 52]
resultat = stats.kruskal(mostra1, mostra2, mostra3)
print(f'Estadístic H: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')Exercici 4: Prova de Chi-quadrat
Provar la independència entre les següents dues variables categòriques utilitzant la prova de Chi-quadrat:
- Taula de contingència: [[8, 12, 15], [10, 14, 20]]
Solució:
import scipy.stats as stats
taula = [[8, 12, 15], [10, 14, 20]]
resultat = stats.chi2_contingency(taula)
print(f'Estadístic Chi-quadrat: {resultat[0]}')
print(f'P-valor: {resultat[1]}')
print(f'Graus de llibertat: {resultat[2]}')
print(f'Esperats: {resultat[3]}')Resum
En aquesta secció, hem explorat els mètodes no paramètrics, incloent-hi les proves de Mann-Whitney U, Wilcoxon, Kruskal-Wallis i Chi-quadrat. Aquests mètodes són útils quan les dades no compleixen les assumpcions necessàries per als mètodes paramètrics. Hem proporcionat exemples de codi en Python per a cada prova i exercicis pràctics per reforçar els conceptes apresos. En el següent mòdul, explorarem les aplicacions pràctiques de l'estadística en diferents camps.
