Introducción
Esta práctica te guiará sobre cómo leer, escribir y manipular datos utilizando Pandas, una poderosa biblioteca de análisis y manipulación de datos para Python. Utilizaremos un conjunto de datos del naufragio del Titanic para este ejercicio.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haz clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tengas que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tienes problemas durante el aprendizaje, no dudes en preguntar a Labby. Proporciona retroalimentación después de la sesión y resolveremos rápidamente el problema para ti.
Importando las bibliotecas necesarias
En primer lugar, necesitamos importar las bibliotecas necesarias para nuestra tarea. Para esta práctica, solo necesitaremos pandas.
## Importando la biblioteca pandas
import pandas as pd
Leyendo datos desde un archivo CSV
El siguiente paso es leer los datos de un archivo CSV. Utilizaremos la función read_csv de pandas para hacer esto.
## Leyendo datos desde un archivo CSV
titanic = pd.read_csv("data/titanic.csv")
Comprobando los datos
Después de leer los datos, siempre es una buena idea comprobar cómo se ven. Mostraremos las primeras filas del DataFrame.
## Mostrando las primeras filas del DataFrame
titanic.head()
Comprobando los tipos de datos
Podemos comprobar los tipos de datos de cada columna utilizando el atributo dtypes del DataFrame.
## Comprobando los tipos de datos de cada columna
titanic.dtypes
Escribiendo datos en un archivo Excel
También puedes escribir los datos en un archivo Excel utilizando el método to_excel. Guardemos nuestro DataFrame en un archivo Excel.
## Guardando el DataFrame en un archivo Excel
titanic.to_excel("titanic.xlsx", sheet_name="passengers", index=False)
Leyendo datos desde un archivo Excel
Leer datos de un archivo Excel es tan fácil como leer datos de un archivo CSV. Utilizaremos la función read_excel de pandas.
## Leyendo datos desde un archivo Excel
titanic = pd.read_excel("titanic.xlsx", sheet_name="passengers")
Comprobando la información del DataFrame
El método info proporciona un resumen técnico de un DataFrame. Esto puede ser útil para comprobar los tipos de datos, el número de valores no nulos y el uso de memoria.
## Comprobando la información del DataFrame
titanic.info()
Resumen
En este laboratorio, aprendimos cómo leer y escribir datos utilizando pandas, y cómo comprobar la información de un DataFrame. Pandas ofrece una amplia gama de funcionalidades para manejar y manipular datos, lo que la convierte en una herramienta poderosa para el análisis de datos.