Introducción
En este laboratorio, aprenderemos a usar el método DataFrame.memory_usage() de Pandas en Python. Este método nos permite calcular el uso de memoria de cada columna en un DataFrame. Veremos instrucciones paso a paso sobre cómo usar este método con ejemplos.
Consejos sobre la VM
Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Importar las bibliotecas necesarias y crear un DataFrame
- Antes de comenzar, importemos la biblioteca
pandasy creemos un DataFrame. - Crea un DataFrame con algunos datos de muestra.
## Import pandas library
import pandas as pd
## Create a DataFrame
df = pd.DataFrame({'Name': ['Abhishek', 'Anurag', 'Divya'],
'Roll No': [100, 101, 104]})
Ver el DataFrame y calcular el uso de memoria
- Ahora, veamos el DataFrame creado y calculemos su uso de memoria utilizando el método
DataFrame.memory_usage().
## View the DataFrame
print("----------El DataFrame es---------")
print(df)
print("-----------------------------------")
## Calculate memory usage
print(df.memory_usage())
Excluir el índice en el cálculo del uso de memoria
- Por defecto, el método
DataFrame.memory_usage()incluye el uso de memoria del índice del DataFrame. Si queremos excluir el índice del cálculo del uso de memoria, podemos establecer el parámetroindexenFalse.
## Calculate memory usage excluding index
print(df.memory_usage(index=False))
Obtener el consumo total de memoria
- También podemos obtener el consumo total de memoria de las columnas del DataFrame utilizando el método
DataFrame.memory_usage()junto con la funciónsum().
## Get overall memory consumption
print(df.memory_usage(index=False).sum())
Resumen
En este laboratorio, aprendimos cómo usar el método DataFrame.memory_usage() en Python Pandas. Este método nos permite calcular el uso de memoria de cada columna en un DataFrame. Podemos incluir o excluir el índice en el cálculo del uso de memoria según nuestras necesidades, y también obtener el consumo total de memoria de las columnas del DataFrame. Comprender el uso de memoria de un DataFrame puede ayudar a optimizar nuestro código y mejorar el rendimiento.