Introducció
L'estadística és una eina fonamental en les ciències socials, ja que permet als investigadors analitzar dades, identificar patrons i fer inferències sobre les poblacions d'estudi. Aquest tema se centra en l'aplicació de mètodes estadístics en disciplines com la sociologia, la psicologia, l'economia i la ciència política.
Objectius del Tema
- Comprendre la importància de l'estadística en les ciències socials.
- Aprendre a aplicar tècniques estadístiques per analitzar dades socials.
- Desenvolupar habilitats per interpretar resultats estadístics en el context de les ciències socials.
Conceptes Clau
- Importància de l'Estadística en les Ciències Socials
- Anàlisi de Dades: Permet als investigadors comprendre millor els fenòmens socials mitjançant l'anàlisi de dades recollides.
- Inferència: Ajuda a fer prediccions i inferències sobre poblacions més grans a partir de mostres.
- Validació d'Hipòtesis: Facilita la comprovació d'hipòtesis i la validació de teories socials.
- Tipus de Dades en Ciències Socials
- Dades Qualitatives: Informació no numèrica que descriu qualitats o característiques (per exemple, opinions, comportaments).
- Dades Quantitatives: Informació numèrica que es pot mesurar i analitzar estadísticament (per exemple, ingressos, edat).
- Mètodes Estadístics Comuns
- Descripció de Dades: Ús de mesures de tendència central (mitjana, mediana, moda) i mesures de dispersió (rang, desviació estàndard).
- Anàlisi de Correlació: Estudi de la relació entre dues variables.
- Anàlisi de Regressió: Modelatge de la relació entre una variable dependent i una o més variables independents.
- Proves d'Hipòtesis: Comprovació d'hipòtesis sobre les dades recollides.
Exemples Pràctics
Exemple 1: Anàlisi de Correlació
Situació: Un sociòleg vol estudiar la relació entre el nivell d'educació i els ingressos.
Dades:
Codi en Python:
import numpy as np
import matplotlib.pyplot as plt
# Dades
educacio = np.array([12, 14, 16, 18, 20])
ingressos = np.array([25, 30, 35, 40, 50])
# Correlació
correlacio = np.corrcoef(educacio, ingressos)[0, 1]
print(f"Coeficient de correlació: {correlacio}")
# Gràfic de dispersió
plt.scatter(educacio, ingressos)
plt.xlabel('Nivell d\'Educació (anys)')
plt.ylabel('Ingressos (milers d\'euros)')
plt.title('Relació entre Nivell d\'Educació i Ingressos')
plt.show()Explicació:
- El coeficient de correlació mesura la força i la direcció de la relació lineal entre dues variables.
- En aquest exemple, un coeficient de correlació positiu indica que a mesura que augmenta el nivell d'educació, també augmenten els ingressos.
Exemple 2: Anàlisi de Regressió
Situació: Un psicòleg vol predir el nivell d'estrès basat en les hores de treball setmanals.
Dades:
Codi en Python:
from sklearn.linear_model import LinearRegression
# Dades
hores_treball = np.array([35, 40, 45, 50, 55]).reshape(-1, 1)
nivell_estres = np.array([3, 4, 5, 6, 7])
# Model de regressió
model = LinearRegression()
model.fit(hores_treball, nivell_estres)
# Predicció
hores_noves = np.array([60]).reshape(-1, 1)
prediccio_estres = model.predict(hores_noves)
print(f"Predicció del nivell d'estrès per 60 hores de treball: {prediccio_estres[0]}")
# Gràfic de regressió
plt.scatter(hores_treball, nivell_estres, color='blue')
plt.plot(hores_treball, model.predict(hores_treball), color='red')
plt.xlabel('Hores de Treball')
plt.ylabel('Nivell d\'Estrès')
plt.title('Regressió entre Hores de Treball i Nivell d\'Estrès')
plt.show()Explicació:
- La regressió lineal permet modelar la relació entre una variable dependent (nivell d'estrès) i una variable independent (hores de treball).
- En aquest exemple, el model prediu el nivell d'estrès per a 60 hores de treball setmanals.
Exercicis Pràctics
Exercici 1: Anàlisi de Correlació
Situació: Un economista vol estudiar la relació entre la taxa d'atur i la inflació.
Dades:
Instruccions:
- Calculeu el coeficient de correlació entre la taxa d'atur i la inflació.
- Creeu un gràfic de dispersió per visualitzar la relació.
Solució:
# Dades
taxa_atur = np.array([5, 6, 7, 8, 9])
inflacio = np.array([2, 2.5, 3, 3.5, 4])
# Correlació
correlacio = np.corrcoef(taxa_atur, inflacio)[0, 1]
print(f"Coeficient de correlació: {correlacio}")
# Gràfic de dispersió
plt.scatter(taxa_atur, inflacio)
plt.xlabel('Taxa d\'Atur (%)')
plt.ylabel('Inflació (%)')
plt.title('Relació entre Taxa d\'Atur i Inflació')
plt.show()Exercici 2: Anàlisi de Regressió
Situació: Un politòleg vol predir el nombre de vots basat en la despesa en campanya electoral.
Dades:
Instruccions:
- Ajusteu un model de regressió lineal per predir el nombre de vots basat en la despesa en campanya.
- Prediu el nombre de vots per una despesa de 60 milers d'euros.
Solució:
# Dades
despesa_campanya = np.array([10, 20, 30, 40, 50]).reshape(-1, 1)
nombre_vots = np.array([1, 2, 3, 4, 5])
# Model de regressió
model = LinearRegression()
model.fit(despesa_campanya, nombre_vots)
# Predicció
despesa_nova = np.array([60]).reshape(-1, 1)
prediccio_vots = model.predict(despesa_nova)
print(f"Predicció del nombre de vots per 60 milers d'euros de despesa: {prediccio_vots[0]}")
# Gràfic de regressió
plt.scatter(despesa_campanya, nombre_vots, color='blue')
plt.plot(despesa_campanya, model.predict(despesa_campanya), color='red')
plt.xlabel('Despesa en Campanya (milers d\'euros)')
plt.ylabel('Nombre de Vots (milers)')
plt.title('Regressió entre Despesa en Campanya i Nombre de Vots')
plt.show()Conclusió
L'estadística és una eina poderosa per a les ciències socials, permetent als investigadors analitzar dades, validar hipòtesis i fer inferències sobre poblacions. Mitjançant l'ús de tècniques com l'anàlisi de correlació i la regressió, els professionals poden obtenir informació valuosa sobre els fenòmens socials i prendre decisions informades. Els exercicis pràctics proporcionats ajuden a consolidar aquests conceptes i a desenvolupar habilitats analítiques aplicables en diversos contextos de les ciències socials.
