Manipulación de datos con Pandas

PythonPythonBeginner
Practicar Ahora

This tutorial is from open-source community. Access the source code

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

Esta práctica te guiará sobre cómo leer, escribir y manipular datos utilizando Pandas, una poderosa biblioteca de análisis y manipulación de datos para Python. Utilizaremos un conjunto de datos del naufragio del Titanic para este ejercicio.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haz clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tengas que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tienes problemas durante el aprendizaje, no dudes en preguntar a Labby. Proporciona retroalimentación después de la sesión y resolveremos rápidamente el problema para ti.

Importando las bibliotecas necesarias

En primer lugar, necesitamos importar las bibliotecas necesarias para nuestra tarea. Para esta práctica, solo necesitaremos pandas.

## Importando la biblioteca pandas
import pandas as pd

Leyendo datos desde un archivo CSV

El siguiente paso es leer los datos de un archivo CSV. Utilizaremos la función read_csv de pandas para hacer esto.

## Leyendo datos desde un archivo CSV
titanic = pd.read_csv("data/titanic.csv")

Comprobando los datos

Después de leer los datos, siempre es una buena idea comprobar cómo se ven. Mostraremos las primeras filas del DataFrame.

## Mostrando las primeras filas del DataFrame
titanic.head()

Comprobando los tipos de datos

Podemos comprobar los tipos de datos de cada columna utilizando el atributo dtypes del DataFrame.

## Comprobando los tipos de datos de cada columna
titanic.dtypes

Escribiendo datos en un archivo Excel

También puedes escribir los datos en un archivo Excel utilizando el método to_excel. Guardemos nuestro DataFrame en un archivo Excel.

## Guardando el DataFrame en un archivo Excel
titanic.to_excel("titanic.xlsx", sheet_name="passengers", index=False)

Leyendo datos desde un archivo Excel

Leer datos de un archivo Excel es tan fácil como leer datos de un archivo CSV. Utilizaremos la función read_excel de pandas.

## Leyendo datos desde un archivo Excel
titanic = pd.read_excel("titanic.xlsx", sheet_name="passengers")

Comprobando la información del DataFrame

El método info proporciona un resumen técnico de un DataFrame. Esto puede ser útil para comprobar los tipos de datos, el número de valores no nulos y el uso de memoria.

## Comprobando la información del DataFrame
titanic.info()

Resumen

En este laboratorio, aprendimos cómo leer y escribir datos utilizando pandas, y cómo comprobar la información de un DataFrame. Pandas ofrece una amplia gama de funcionalidades para manejar y manipular datos, lo que la convierte en una herramienta poderosa para el análisis de datos.