MAT281 - Laboratorio N°08: Distribuciones Muestrales y Teorema Central del Limite¶
Objetivos del laboratorio¶
- Distinguir entre parametro poblacional y estadistico muestral.
- Reconocer y graficar las distribuciones Normal, t-Student, Chi-cuadrado y F.
- Simular la distribucion muestral de la media.
- Verificar empiricamente el Teorema Central del Limite (TCL).
- Calcular e interpretar el error estandar de la media.
Instrucciones¶
Lea con atencion cada problema antes de resolverlo. Reemplace cada celda que contiene # FIXME con su propia solucion y, cuando se solicite, responda las preguntas en celdas de texto.
Nota: Puede apoyarse en asistentes virtuales (ChatGPT, Gemini, Claude) o en el autocompletado de Colab, pero asegurese de entender cada linea de codigo que entregue.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
sns.set_theme(style="whitegrid")
rng = np.random.default_rng(2025)
Problema 01 — Parametro vs estadistico¶
Considera la columna Total del dataset de ventas de supermercado como la
poblacion completa.
Tu tarea:
- Carga el dataset y calcula la media poblacional $\mu$ y la desviacion
poblacional $\sigma$ de
Total. - Extrae una muestra aleatoria de tamaño $n=30$ (
df.sample) y calcula su media $\bar{x}$ y desviacion $s$. - Pregunta: ¿coinciden exactamente? Explica la diferencia entre parametro y estadistico.
df = pd.read_csv("https://raw.githubusercontent.com/fralfaro/MAT281/main/docs/lectures/statistics/data/supermarket_sales.csv")
df.head()
# FIXME
Respuesta (Problema 01): (escribe aqui)
Problema 02 — Las cuatro distribuciones clave¶
Tu tarea: en una figura con 4 subplots, grafica la funcion de densidad de:
- Normal estandar $N(0,1)$.
- t-Student con 5 grados de libertad (compara con la Normal).
- Chi-cuadrado con 4 grados de libertad.
- F con $(5, 10)$ grados de libertad.
Usa stats.norm, stats.t, stats.chi2 y stats.f con su metodo .pdf.
# FIXME
Problema 03 — Distribucion muestral de la media¶
Tu tarea:
- Repite 2000 veces el experimento de tomar una muestra de tamaño $n=30$ de
la poblacion (
Total) y guarda la media de cada muestra. - Grafica el histograma de esas 2000 medias.
- Pregunta: ¿alrededor de que valor se centran? Compara con $\mu$.
# FIXME
Problema 04 — Teorema Central del Limite¶
El TCL afirma que la distribucion de la media muestral tiende a una Normal a medida que $n$ crece, sin importar la forma de la poblacion original.
Tu tarea:
- Parte de una poblacion claramente no normal (por ejemplo
rng.exponential(scale=2, size=100000)). - Para $n \in \{2, 5, 30, 100\}$, simula 2000 medias muestrales y grafica sus histogramas (un subplot por cada $n$).
- Pregunta: ¿que observas a medida que aumenta $n$?
# FIXME
Problema 05 — Error estandar¶
El error estandar de la media es $\mathrm{SE} = \sigma/\sqrt{n}$.
Tu tarea:
- Para $n \in \{10, 30, 50, 100, 500\}$ calcula el SE teorico usando la $\sigma$ poblacional.
- Grafica el SE en funcion de $n$.
- Pregunta: ¿que ocurre con la precision de la estimacion cuando aumenta el tamaño muestral?
# FIXME
Respuesta: (escribe aqui)