Trabajando con Pandas

Beginner

This tutorial is from open-source community. Access the source code

Introducción

Pandas es una poderosa herramienta de manipulación de datos desarrollada en Python. A menudo se utiliza en el análisis y limpieza de datos debido a su flexibilidad y facilidad de uso. En este laboratorio, aprenderemos cómo usar Pandas para realizar operaciones básicas como cargar datos, crear marcos de datos, acceder a datos y realizar estadísticas simples.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Este es un Guided Lab, que proporciona instrucciones paso a paso para ayudarte a aprender y practicar. Sigue las instrucciones cuidadosamente para completar cada paso y obtener experiencia práctica. Los datos históricos muestran que este es un laboratorio de nivel principiante con una tasa de finalización del 86%. Ha recibido una tasa de reseñas positivas del 100% por parte de los estudiantes.

Importar el paquete Pandas

Antes de poder usar Pandas, es necesario importarlo. Es una práctica común importar Pandas con el alias pd.

## Importando el paquete pandas
import pandas as pd

Crear un DataFrame

Los datos en pandas se almacenan en un DataFrame, que es una estructura de datos etiquetada bidimensional con columnas que pueden ser de diferentes tipos.

## Creando un DataFrame
df = pd.DataFrame(
    {
        "Nombre": [
            "Braund, Sr. Owen Harris",
            "Allen, Sr. William Henry",
            "Bonnell, Sra. Elizabeth",
        ],
        "Edad": [22, 35, 58],
        "Sexo": ["masculino", "masculino", "femenino"],
    }
)

Seleccionar una columna

Si desea trabajar con los datos de una columna específica, puede seleccionarla utilizando la etiqueta de la columna. El resultado es una Serie de pandas.

## Seleccionando la columna 'Edad'
df["Edad"]

Realizar estadísticas básicas

Pandas ofrece muchas funcionalidades para realizar estadísticas. Por ejemplo, puede encontrar el valor máximo en una columna utilizando max().

## Encontrando la edad máxima
df["Edad"].max()

También puede obtener una visión general rápida de los datos numéricos en un DataFrame utilizando describe().

## Describiendo los datos numéricos
df.describe()

Resumen

En este laboratorio, aprendimos cómo importar el paquete Pandas, crear un DataFrame, seleccionar una columna y realizar estadísticas básicas. Pandas es una herramienta versátil que puede manejar datos de diferentes tipos, lo que la convierte en una gran opción para el análisis y manipulación de datos.