MAT281 - Laboratorio N°11: Inferencia en Regresion Lineal Simple¶
Objetivos del laboratorio¶
- Ajustar un modelo de regresion lineal simple con
statsmodels. - Leer e interpretar la tabla
summary()(coeficientes, $R^2$, errores). - Realizar pruebas t sobre los coeficientes e interpretar sus valores-p.
- Construir intervalos de confianza para los coeficientes y predicciones.
- Diagnosticar el modelo analizando los residuos.
Instrucciones¶
Lea con atencion cada problema antes de resolverlo. Reemplace cada celda que contiene # FIXME con su propia solucion y, cuando se solicite, responda las preguntas en celdas de texto.
Nota: Puede apoyarse en asistentes virtuales (ChatGPT, Gemini, Claude) o en el autocompletado de Colab, pero asegurese de entender cada linea de codigo que entregue.
Requisito:
# !pip install statsmodels
In [ ]:
Copied!
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
import statsmodels.formula.api as smf
df = pd.read_csv("https://raw.githubusercontent.com/fralfaro/MAT281/main/docs/lectures/statistics/data/supermarket_sales.csv")
df.head()
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
import statsmodels.formula.api as smf
df = pd.read_csv("https://raw.githubusercontent.com/fralfaro/MAT281/main/docs/lectures/statistics/data/supermarket_sales.csv")
df.head()
Problema 01 — Visualizacion de la relacion¶
Modelaremos el Total de la venta en funcion del Unit price.
Tu tarea:
- Construye un grafico de dispersion de
Total(eje Y) vsUnit price(eje X). - Añade una recta de tendencia con
sns.regplot. - Pregunta: ¿la relacion se ve positiva, negativa o nula?
In [ ]:
Copied!
# FIXME
# FIXME
Problema 02 — Ajuste del modelo¶
Tu tarea:
- Ajusta el modelo $\text{Total} = \beta_0 + \beta_1\,\text{UnitPrice} + \epsilon$
con
smf.ols(...).fit(). - Muestra el
summary(). - Escribe la ecuacion estimada de la recta con los coeficientes obtenidos.
In [ ]:
Copied!
# FIXME
# FIXME
Ecuacion estimada (Problema 02): (escribe aqui)
Problema 03 — Pruebas t sobre los coeficientes¶
Tu tarea: a partir del summary():
- Identifica el valor-p del coeficiente de
Unit price. - Con $\alpha = 0.05$: ¿es
Unit priceun predictor estadisticamente significativo delTotal? - Interpreta el valor del coeficiente $\beta_1$ en el contexto del problema.
Respuesta (Problema 03): (escribe aqui)
Problema 04 — Intervalos de confianza¶
Tu tarea:
- Obten los IC del 95% para los coeficientes con
modelo.conf_int(). - Interpreta el intervalo del coeficiente $\beta_1$.
- Pregunta: ¿el intervalo de $\beta_1$ contiene al 0? ¿Es coherente con la prueba t del problema anterior?
In [ ]:
Copied!
# FIXME
# FIXME
Respuesta (Problema 04): (escribe aqui)
Problema 05 — Diagnostico de residuos¶
Tu tarea:
- Calcula los residuos (
modelo.resid) y los valores ajustados (modelo.fittedvalues). - Grafica residuos vs valores ajustados. ¿Se observa algun patron (que indicaria problemas) o se ven aleatorios?
- Grafica un QQ-plot de los residuos (
sm.qqplot). ¿Parecen normales?
In [ ]:
Copied!
# FIXME
# FIXME
Conclusion del diagnostico (Problema 05): (escribe aqui)