Introducción
Pandas es una poderosa herramienta de manipulación de datos desarrollada en Python. A menudo se utiliza en el análisis y limpieza de datos debido a su flexibilidad y facilidad de uso. En este laboratorio, aprenderemos cómo usar Pandas para realizar operaciones básicas como cargar datos, crear marcos de datos, acceder a datos y realizar estadísticas simples.
Consejos sobre la VM
Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Importar el paquete Pandas
Antes de poder usar Pandas, es necesario importarlo. Es una práctica común importar Pandas con el alias pd.
## Importando el paquete pandas
import pandas as pd
Crear un DataFrame
Los datos en pandas se almacenan en un DataFrame, que es una estructura de datos etiquetada bidimensional con columnas que pueden ser de diferentes tipos.
## Creando un DataFrame
df = pd.DataFrame(
{
"Nombre": [
"Braund, Sr. Owen Harris",
"Allen, Sr. William Henry",
"Bonnell, Sra. Elizabeth",
],
"Edad": [22, 35, 58],
"Sexo": ["masculino", "masculino", "femenino"],
}
)
Seleccionar una columna
Si desea trabajar con los datos de una columna específica, puede seleccionarla utilizando la etiqueta de la columna. El resultado es una Serie de pandas.
## Seleccionando la columna 'Edad'
df["Edad"]
Realizar estadísticas básicas
Pandas ofrece muchas funcionalidades para realizar estadísticas. Por ejemplo, puede encontrar el valor máximo en una columna utilizando max().
## Encontrando la edad máxima
df["Edad"].max()
También puede obtener una visión general rápida de los datos numéricos en un DataFrame utilizando describe().
## Describiendo los datos numéricos
df.describe()
Resumen
En este laboratorio, aprendimos cómo importar el paquete Pandas, crear un DataFrame, seleccionar una columna y realizar estadísticas básicas. Pandas es una herramienta versátil que puede manejar datos de diferentes tipos, lo que la convierte en una gran opción para el análisis y manipulación de datos.