Trabajando con Pandas

PythonPythonBeginner
Practicar Ahora

This tutorial is from open-source community. Access the source code

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

Pandas es una poderosa herramienta de manipulación de datos desarrollada en Python. A menudo se utiliza en el análisis y limpieza de datos debido a su flexibilidad y facilidad de uso. En este laboratorio, aprenderemos cómo usar Pandas para realizar operaciones básicas como cargar datos, crear marcos de datos, acceder a datos y realizar estadísticas simples.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/BasicConceptsGroup(["Basic Concepts"]) python(("Python")) -.-> python/DataStructuresGroup(["Data Structures"]) python(("Python")) -.-> python/FunctionsGroup(["Functions"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python/BasicConceptsGroup -.-> python/comments("Comments") pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") python/DataStructuresGroup -.-> python/lists("Lists") python/DataStructuresGroup -.-> python/tuples("Tuples") python/DataStructuresGroup -.-> python/dictionaries("Dictionaries") python/FunctionsGroup -.-> python/build_in_functions("Build-in Functions") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/DataScienceandMachineLearningGroup -.-> python/numerical_computing("Numerical Computing") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills python/comments -.-> lab-65430{{"Trabajando con Pandas"}} pandas/select_columns -.-> lab-65430{{"Trabajando con Pandas"}} python/lists -.-> lab-65430{{"Trabajando con Pandas"}} python/tuples -.-> lab-65430{{"Trabajando con Pandas"}} python/dictionaries -.-> lab-65430{{"Trabajando con Pandas"}} python/build_in_functions -.-> lab-65430{{"Trabajando con Pandas"}} python/importing_modules -.-> lab-65430{{"Trabajando con Pandas"}} python/numerical_computing -.-> lab-65430{{"Trabajando con Pandas"}} python/data_analysis -.-> lab-65430{{"Trabajando con Pandas"}} end

Importar el paquete Pandas

Antes de poder usar Pandas, es necesario importarlo. Es una práctica común importar Pandas con el alias pd.

## Importando el paquete pandas
import pandas as pd

Crear un DataFrame

Los datos en pandas se almacenan en un DataFrame, que es una estructura de datos etiquetada bidimensional con columnas que pueden ser de diferentes tipos.

## Creando un DataFrame
df = pd.DataFrame(
    {
        "Nombre": [
            "Braund, Sr. Owen Harris",
            "Allen, Sr. William Henry",
            "Bonnell, Sra. Elizabeth",
        ],
        "Edad": [22, 35, 58],
        "Sexo": ["masculino", "masculino", "femenino"],
    }
)

Seleccionar una columna

Si desea trabajar con los datos de una columna específica, puede seleccionarla utilizando la etiqueta de la columna. El resultado es una Serie de pandas.

## Seleccionando la columna 'Edad'
df["Edad"]

Realizar estadísticas básicas

Pandas ofrece muchas funcionalidades para realizar estadísticas. Por ejemplo, puede encontrar el valor máximo en una columna utilizando max().

## Encontrando la edad máxima
df["Edad"].max()

También puede obtener una visión general rápida de los datos numéricos en un DataFrame utilizando describe().

## Describiendo los datos numéricos
df.describe()

Resumen

En este laboratorio, aprendimos cómo importar el paquete Pandas, crear un DataFrame, seleccionar una columna y realizar estadísticas básicas. Pandas es una herramienta versátil que puede manejar datos de diferentes tipos, lo que la convierte en una gran opción para el análisis y manipulación de datos.