Método de uso de memoria de DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos a usar el método DataFrame.memory_usage() de Pandas en Python. Este método nos permite calcular el uso de memoria de cada columna en un DataFrame. Veremos instrucciones paso a paso sobre cómo usar este método con ejemplos.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) python(("Python")) -.-> python/FunctionsGroup(["Functions"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") pandas/ReadingDataGroup -.-> pandas/read_excel("Read Excel") python/FunctionsGroup -.-> python/build_in_functions("Build-in Functions") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") pandas/DataAnalysisGroup -.-> pandas/basic_statistics("Basic Statistics") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") python/DataScienceandMachineLearningGroup -.-> python/data_visualization("Data Visualization") subgraph Lab Skills pandas/read_csv -.-> lab-68664{{"Método de uso de memoria de DataFrame de Pandas"}} pandas/read_excel -.-> lab-68664{{"Método de uso de memoria de DataFrame de Pandas"}} python/build_in_functions -.-> lab-68664{{"Método de uso de memoria de DataFrame de Pandas"}} python/importing_modules -.-> lab-68664{{"Método de uso de memoria de DataFrame de Pandas"}} pandas/basic_statistics -.-> lab-68664{{"Método de uso de memoria de DataFrame de Pandas"}} python/data_collections -.-> lab-68664{{"Método de uso de memoria de DataFrame de Pandas"}} python/data_analysis -.-> lab-68664{{"Método de uso de memoria de DataFrame de Pandas"}} python/data_visualization -.-> lab-68664{{"Método de uso de memoria de DataFrame de Pandas"}} end

Importar las bibliotecas necesarias y crear un DataFrame

  • Antes de comenzar, importemos la biblioteca pandas y creemos un DataFrame.
  • Crea un DataFrame con algunos datos de muestra.
## Import pandas library
import pandas as pd

## Create a DataFrame
df = pd.DataFrame({'Name': ['Abhishek', 'Anurag', 'Divya'],
                   'Roll No': [100, 101, 104]})

Ver el DataFrame y calcular el uso de memoria

  • Ahora, veamos el DataFrame creado y calculemos su uso de memoria utilizando el método DataFrame.memory_usage().
## View the DataFrame
print("----------El DataFrame es---------")
print(df)
print("-----------------------------------")

## Calculate memory usage
print(df.memory_usage())

Excluir el índice en el cálculo del uso de memoria

  • Por defecto, el método DataFrame.memory_usage() incluye el uso de memoria del índice del DataFrame. Si queremos excluir el índice del cálculo del uso de memoria, podemos establecer el parámetro index en False.
## Calculate memory usage excluding index
print(df.memory_usage(index=False))

Obtener el consumo total de memoria

  • También podemos obtener el consumo total de memoria de las columnas del DataFrame utilizando el método DataFrame.memory_usage() junto con la función sum().
## Get overall memory consumption
print(df.memory_usage(index=False).sum())

Resumen

En este laboratorio, aprendimos cómo usar el método DataFrame.memory_usage() en Python Pandas. Este método nos permite calcular el uso de memoria de cada columna en un DataFrame. Podemos incluir o excluir el índice en el cálculo del uso de memoria según nuestras necesidades, y también obtener el consumo total de memoria de las columnas del DataFrame. Comprender el uso de memoria de un DataFrame puede ayudar a optimizar nuestro código y mejorar el rendimiento.