Introducción¶
Las secciones anteriores describen las ideas fundamentales del aprendizaje automático, pero todos los ejemplos asumen que tiene datos numéricos en un formato ordenado, [n_samples, n_features]
. En el mundo real, los datos rara vez vienen en esa forma. Con esto en mente, uno de los pasos más importantes en el uso del aprendizaje automático en la práctica es la ingeniería de características (Feature Engineering): es decir, tomar cualquier información que tenga sobre su problema y convertirla en números que pueda usar para construir su matriz de características.
En esta sección, cubriremos algunos ejemplos comunes de tareas de Feature Engineering.