Método de uso de memoria de DataFrame de Pandas

Beginner

Introducción

En este laboratorio, aprenderemos a usar el método DataFrame.memory_usage() de Pandas en Python. Este método nos permite calcular el uso de memoria de cada columna en un DataFrame. Veremos instrucciones paso a paso sobre cómo usar este método con ejemplos.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar las bibliotecas necesarias y crear un DataFrame

  • Antes de comenzar, importemos la biblioteca pandas y creemos un DataFrame.
  • Crea un DataFrame con algunos datos de muestra.
## Import pandas library
import pandas as pd

## Create a DataFrame
df = pd.DataFrame({'Name': ['Abhishek', 'Anurag', 'Divya'],
                   'Roll No': [100, 101, 104]})

Ver el DataFrame y calcular el uso de memoria

  • Ahora, veamos el DataFrame creado y calculemos su uso de memoria utilizando el método DataFrame.memory_usage().
## View the DataFrame
print("----------El DataFrame es---------")
print(df)
print("-----------------------------------")

## Calculate memory usage
print(df.memory_usage())

Excluir el índice en el cálculo del uso de memoria

  • Por defecto, el método DataFrame.memory_usage() incluye el uso de memoria del índice del DataFrame. Si queremos excluir el índice del cálculo del uso de memoria, podemos establecer el parámetro index en False.
## Calculate memory usage excluding index
print(df.memory_usage(index=False))

Obtener el consumo total de memoria

  • También podemos obtener el consumo total de memoria de las columnas del DataFrame utilizando el método DataFrame.memory_usage() junto con la función sum().
## Get overall memory consumption
print(df.memory_usage(index=False).sum())

Resumen

En este laboratorio, aprendimos cómo usar el método DataFrame.memory_usage() en Python Pandas. Este método nos permite calcular el uso de memoria de cada columna en un DataFrame. Podemos incluir o excluir el índice en el cálculo del uso de memoria según nuestras necesidades, y también obtener el consumo total de memoria de las columnas del DataFrame. Comprender el uso de memoria de un DataFrame puede ayudar a optimizar nuestro código y mejorar el rendimiento.