Sobre el curso
Descripción de la Asignatura
La asignatura tiene como objetivo proporcionar a los estudiantes las competencias y destrezas básicas necesarias para desempeñarse como Data Scientist utilizando el lenguaje de programación Python.
Requisitos de entrada
- Fundamentos de Cálculo y Álgebra.
- Conceptos básicos de Probabilidad y Estadística.
- Conocimientos en Optimización.
- Familiaridad con el lenguaje de programación Python.
Contenidos temáticos
El curso se organiza en torno a los siguientes temas principales:
- Toolkit Básico: Introducción a las herramientas esenciales para el análisis de datos.
- Manipulación de Datos: Técnicas para la manipulación eficiente de conjuntos de datos.
- Visualización: Métodos para visualizar datos de manera efectiva.
- Machine Learning: Introducción a los conceptos básicos y aplicaciones del aprendizaje automático.
Recursos para el Aprendizaje
1. Textos Guía Principales
Estos textos son esenciales para desarrollar una comprensión sólida de la ciencia de datos y el aprendizaje automático utilizando Python:
- Python Data Science Handbook por Jake VanderPlas: Un recurso integral que cubre desde las bases de Python hasta técnicas avanzadas de ciencia de datos, con un enfoque práctico utilizando librerías como NumPy, Pandas, Matplotlib, Scikit-Learn, entre otras.
2. Lecturas Complementarias
Estos libros ofrecen una profundización en áreas específicas y son recomendados para aquellos que desean ampliar su conocimiento más allá de los conceptos básicos:
-
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow por Aurélien Géron: Una guía práctica para el aprendizaje automático utilizando herramientas poderosas como Scikit-Learn, Keras y TensorFlow. Ideal para quienes quieren aplicar técnicas de machine learning a proyectos reales.
-
Data Science from Scratch por Joel Grus: Este libro es excelente para aquellos que prefieren aprender los fundamentos de la ciencia de datos desde cero, sin depender de bibliotecas, lo que permite un entendimiento más profundo de los algoritmos.
-
Python for Data Analysis por Wes McKinney: Escrito por el creador de Pandas, este libro es una referencia obligatoria para cualquiera que quiera dominar la manipulación y el análisis de datos en Python.
3. Repositorios
Estos repositorios de GitHub contienen material práctico y ejemplos que complementan los textos y permiten poner en práctica lo aprendido:
-
python_intro: Un curso introductorio de Python que cubre los conceptos básicos de programación y los fundamentos del lenguaje.
-
python_eda: Un curso enfocado en la manipulación y análisis exploratorio de datos (EDA) en Python, utilizando librerías como Pandas y Matplotlib.
-
python_ml: Un curso sobre aprendizaje automático (machine learning) en Python, que abarca desde los algoritmos más simples hasta técnicas más avanzadas.
Evaluación
Laboratorios
- Semanal.
- Individual.
- Notas: 0, 25, 50, 75, 100.
- Plazo: final del día de clases.
- Entregas fuera del plazo tienen nota cero (0).
Tareas
- Mensual.
- Individual.
- Plazo:
- \(T_1\): 30 de Septiembre 2024.
- \(T_2\): 25 de Noviembre 2024.
- Entregas fuera del plazo descuentan 25 puntos por día (parte entera).
- Por ejemplo, un retraso de 15 minutos cuenta como un día y descuenta 25 puntos.
Proyecto
- Semestral.
- Plazo: final del curso (05 de Diciembre 2024).
- Grupal: máximo 4 integrantes.
- Entregas fuera del plazo descuentan 25 puntos por día (parte entera).
Nota Final
La nota final será el promedio ponderado entre los laboratorios, tareas y el proyecto final del curso.
¡Importante!: Todos los entregables se deben subir al repositorio personal del estudiante (en GitHub). Las notas se trataran de actualizar al final de cada mes.