Saltar a contenido

Proyecto Final

Introducción

La finalidad de este proyecto es enfrentar a los estudiantes a problemas de Machine Learning con todas las etapas (típicas) que eso implica, basándose en cada uno de los módulos aprendidos a lo largo del curso, dando pie a la investigación y a la solución de problemas operacionales del mundo real.

Descripción del Proyecto

Bienvenido al año 2912, donde se necesitan tus habilidades de ciencia de datos para resolver un misterio cósmico. Hemos recibido una transmisión desde cuatro años luz de distancia y las cosas no pintan bien.

La nave espacial Titanic fue un transatlántico de pasajeros interestelar lanzado hace un mes. Con casi 13.000 pasajeros a bordo, la nave emprendió su viaje inaugural transportando emigrantes de nuestro sistema solar a tres exoplanetas recientemente habitables que orbitan estrellas cercanas.

Mientras rodeaba Alpha Centauri en ruta hacia su primer destino, el tórrido 55 Cancri E, la desprevenida nave espacial Titanic chocó con una anomalía del espacio-tiempo escondida dentro de una nube de polvo. Lamentablemente, tuvo un destino similar al de su homónimo de 1000 años antes. Aunque la nave permaneció intacta, ¡casi la mitad de los pasajeros fueron transportados a una dimensión alternativa!

Evaluación

El proyecto final consta de dos parte:

  • Parte Técnica: Desarrollar una solución end to end del proyecto utilizando Jupyter Notebook.
  • Presentación de Resultados: Realizar una presentación de 10-20 minutos de sus hallazgos.

Parte Técnica

La Parte técnica debe cumplir con la siguiente rúbrica de trabajo:

  1. Definición del problema
  2. Estadística descriptiva
  3. Visualización descriptiva
  4. Preprocesamiento
  5. Selección de modelo
    1. Por lo menos debe comparar cuatro modelos
    2. Al menos tres de estos modelos tienen que tener hiperparámetros.
    3. Realizar optimización de hiperparámetros.
  6. Métricas y análisis de resultados
  7. Visualizaciones del modelo
  8. Conclusiones

Observación: Tendrá una mejor puntación si también incorpora modelos de redes neuronales. Se deja un tutorial de tensorflow a modo de ejemplo.

La solución debe alojarse en su Portafolio Personal del curso (.ipynb).

Presentación de Resultados

  • La presentación consta de 10-20 minutos.
  • Utilizar diapositivas con BEAMER. Se deja el siguiente el siguiente tutorial a modo de ejemplo.
  • La presentación debe alojarse en su Portafolio Personal del curso (.pdf).

Información Importante

  • Plazo: 05 de Diciembre del 2024 (hasta las 11:59 PM)
  • Esto corresponde a un desafio de Kaggle (link).
  • La información respecto a los datos, lo pueden encontrar en el siguiente link.
  • A modo de inspiración, pueden ocupar algunos gráficos de otros participantes del desafío (link).