Fundamentos de manipulación de datos con Pandas

PythonPythonBeginner
Practicar Ahora

This tutorial is from open-source community. Access the source code

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

Este laboratorio de Python Pandas tiene como objetivo introducirte a las operaciones fundamentales de la biblioteca pandas, que es una herramienta poderosa de manipulación de datos en Python. A lo largo de este laboratorio, trabajarás con numerosos ejemplos y fragmentos de código para consolidar tu comprensión de pandas.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haz clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tengas que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si te encuentras con problemas durante el aprendizaje, no dudes en preguntar a Labby. Proporciona retroalimentación después de la sesión y resolveremos rápidamente el problema para ti.

Importando Pandas

En primer lugar, necesitamos importar la biblioteca pandas. Esto se puede hacer con el siguiente comando:

## Importando la biblioteca pandas
import pandas as pd
import numpy as np

Creando un DataFrame

A continuación, crearemos un DataFrame, que es una estructura de datos etiquetada bidimensional con columnas de tipos potencialmente diferentes. Por lo general, es el objeto de pandas más comúnmente utilizado.

## Creando un DataFrame con un diccionario
df = pd.DataFrame({'A': [1, 2, 3]})

Comprendiendo los DataFrames

Ahora, intentemos entender más sobre el DataFrame que acabamos de crear.

## Mostrando el DataFrame
print(df)

## Información sobre el DataFrame
df.info()

Trabajando con Datos Faltantes

Pandas proporciona varios métodos para limpiar datos y llenar valores faltantes.

## Creando un DataFrame con valores faltantes
df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [5, np.nan, np.nan], 'C': [1, 2, 3]})

## Llenando valores faltantes
df.fillna(value=0, inplace=True)

Visualización de Datos

Pandas permite la visualización de datos al permitir la integración con la biblioteca Matplotlib.

## Importando la biblioteca matplotlib
import matplotlib.pyplot as plt

## Graficando un gráfico
df['A'].plot()
plt.show()

Resumen

En este laboratorio, hemos cubierto algunos de los conceptos básicos de la biblioteca pandas en Python, incluyendo la importación de la biblioteca, la creación y manipulación de un DataFrame, el manejo de datos faltantes y la visualización de datos. Estas habilidades son fundamentales para cualquier tarea de análisis de datos en Python, y dominar pandas te permitirá manejar y analizar datos de manera efectiva.