MAT281 - Laboratorio N°09: Pruebas de Hipotesis¶
Objetivos del laboratorio¶
- Formular hipotesis nula ($H_0$) y alternativa ($H_1$).
- Comprender los errores Tipo I y Tipo II y el nivel de significancia.
- Calcular e interpretar correctamente el valor-p.
- Aplicar pruebas z y t (una muestra, dos muestras, pareadas).
- Tomar decisiones estadisticas y comunicarlas con claridad.
Instrucciones¶
Lea con atencion cada problema antes de resolverlo. Reemplace cada celda que contiene # FIXME con su propia solucion y, cuando se solicite, responda las preguntas en celdas de texto.
Nota: Puede apoyarse en asistentes virtuales (ChatGPT, Gemini, Claude) o en el autocompletado de Colab, pero asegurese de entender cada linea de codigo que entregue.
import numpy as np
import pandas as pd
from scipy import stats
df = pd.read_csv("https://raw.githubusercontent.com/fralfaro/MAT281/main/docs/lectures/statistics/data/supermarket_sales.csv")
df.head()
Problema 01 — Planteando hipotesis¶
La gerencia afirma que el gasto promedio (Total) por ticket es de $320.
Tu tarea:
- Escribe en una celda de texto las hipotesis $H_0$ y $H_1$ (prueba bilateral).
- Identifica: ¿que seria un error Tipo I y un error Tipo II en este contexto?
Respuesta (Problema 01): (escribe aqui $H_0$, $H_1$ y los errores)
Problema 02 — Prueba t de una muestra¶
Tu tarea:
- Usa
stats.ttest_1samppara contrastar si la media deTotaldifiere de 320. - Reporta el estadistico y el valor-p.
- Con $\alpha = 0.05$, ¿rechazas $H_0$? Redacta la conclusion en lenguaje del problema.
# FIXME
Conclusion (Problema 02): (escribe aqui)
Problema 03 — Dos muestras independientes¶
Tu tarea:
- ¿Gastan distinto los clientes
MembervsNormal(columnaCustomer type)? Separa la columnaTotalen dos grupos. - Aplica una prueba t de dos muestras (
stats.ttest_ind). Considera usarequal_var=False(Welch). - Concluye con $\alpha = 0.05$.
# FIXME
Problema 04 — ¿Qué NO significa el valor-p?¶
Lee el resultado del problema anterior.
Tu tarea: indica si cada afirmacion es verdadera o falsa y justifica:
- "El valor-p es la probabilidad de que $H_0$ sea verdadera."
- "Un valor-p pequeño implica que el efecto es grande/importante."
- "Si no rechazo $H_0$, entonces $H_0$ es verdadera."
Respuesta (Problema 04): (escribe aqui)
Problema 05 — Muestras pareadas (simulado)¶
Supongamos que medimos el Rating de 30 clientes antes y despues de una
mejora en el servicio (datos simulados abajo).
Tu tarea:
- Aplica una prueba t de muestras pareadas (
stats.ttest_rel). - ¿Hubo una mejora estadisticamente significativa? Concluye.
rng = np.random.default_rng(1)
antes = rng.normal(6.8, 1.5, size=30)
despues = antes + rng.normal(0.4, 1.0, size=30)
# FIXME
Conclusion (Problema 05): (escribe aqui)