Introducción¶
Pandas es una biblioteca que proporciona estructuras de datos rápidas, flexibles y expresivas diseñadas para que trabajar con datos "relacionales" o "etiquetados" sea fácil e intuitivo.
Su objetivo es ser el bloque de construcción fundamental de alto nivel para hacer análisis de datos prácticos del mundo real en Python. Además, tiene el objetivo más amplio de convertirse en la herramienta de análisis/manipulación de datos de código abierto más potente y flexible disponible en cualquier idioma. Ya está en camino hacia este objetivo.
Las principales estructuras de datos en Pandas son Series
y DataFrames
.
Las
Series
son arreglos unidimensionales con índices. Se puede pensar como una generalización de los arreglos deNumpy
.Los
DataFrames
son arreglos bidimensionales y una extensión natural de lasSeries
.
Origen
Pandas fue desarrollado por Wes McKinney en 2008 mientras trabajaba en AQR Capital Management. McKinney creó Pandas como una herramienta para el análisis y la manipulación de datos para ayudar a los analistas e investigadores a trabajar con conjuntos de datos grandes y complejos de una manera más eficiente e intuitiva. Desde entonces, Pandas se ha convertido en una de las bibliotecas más utilizadas para el análisis de datos en Python y es mantenida por un equipo de colaboradores de código abierto.
Importar librería
Para importar la librería Pandas en Python, simplemente debes usar la palabra reservada import
seguida del nombre de la librería:
import pandas
Al hacerlo, puedes utilizar todas las funciones y objetos disponibles en Pandas. Sin embargo, para ahorrar tiempo en la escritura del código, es común utilizar un alias para Pandas, que generalmente es pd
. Para hacerlo, puedes usar la siguiente línea de código:
import pandas as pd