Méthode d'utilisation mémoire du DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode DataFrame.memory_usage() de Pandas en Python. Cette méthode nous permet de calculer l'utilisation mémoire de chaque colonne dans un DataFrame. Nous allons suivre des instructions étape par étape sur la manière d'utiliser cette méthode avec des exemples.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) python(("Python")) -.-> python/FunctionsGroup(["Functions"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") pandas/ReadingDataGroup -.-> pandas/read_excel("Read Excel") python/FunctionsGroup -.-> python/build_in_functions("Build-in Functions") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") pandas/DataAnalysisGroup -.-> pandas/basic_statistics("Basic Statistics") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") python/DataScienceandMachineLearningGroup -.-> python/data_visualization("Data Visualization") subgraph Lab Skills pandas/read_csv -.-> lab-68664{{"Méthode d'utilisation mémoire du DataFrame Pandas"}} pandas/read_excel -.-> lab-68664{{"Méthode d'utilisation mémoire du DataFrame Pandas"}} python/build_in_functions -.-> lab-68664{{"Méthode d'utilisation mémoire du DataFrame Pandas"}} python/importing_modules -.-> lab-68664{{"Méthode d'utilisation mémoire du DataFrame Pandas"}} pandas/basic_statistics -.-> lab-68664{{"Méthode d'utilisation mémoire du DataFrame Pandas"}} python/data_collections -.-> lab-68664{{"Méthode d'utilisation mémoire du DataFrame Pandas"}} python/data_analysis -.-> lab-68664{{"Méthode d'utilisation mémoire du DataFrame Pandas"}} python/data_visualization -.-> lab-68664{{"Méthode d'utilisation mémoire du DataFrame Pandas"}} end

Importez les bibliothèques nécessaires et créez un DataFrame

  • Avant de commencer, importons la bibliothèque pandas et créons un DataFrame.
  • Créez un DataFrame avec quelques données d'échantillonnage.
## Import pandas library
import pandas as pd

## Create a DataFrame
df = pd.DataFrame({'Name': ['Abhishek', 'Anurag', 'Divya'],
                   'Roll No': [100, 101, 104]})

Consultez le DataFrame et calculez l'utilisation mémoire

  • Maintenant, voyons le DataFrame créé et calculons son utilisation mémoire en utilisant la méthode DataFrame.memory_usage().
## View the DataFrame
print("----------Le DataFrame est---------")
print(df)
print("-----------------------------------")

## Calculate memory usage
print(df.memory_usage())

Exclure l'index du calcul de l'utilisation mémoire

  • Par défaut, la méthode DataFrame.memory_usage() inclut l'utilisation mémoire de l'index du DataFrame. Si nous voulons exclure l'index du calcul de l'utilisation mémoire, nous pouvons définir le paramètre index sur False.
## Calculate memory usage excluding index
print(df.memory_usage(index=False))

Obtenez la consommation mémoire globale

  • Nous pouvons également obtenir la consommation mémoire globale des colonnes d'un DataFrame en utilisant la méthode DataFrame.memory_usage() ainsi que la fonction sum().
## Obtenez la consommation mémoire globale
print(df.memory_usage(index=False).sum())

Sommaire

Dans ce laboratoire, nous avons appris à utiliser la méthode DataFrame.memory_usage() dans Python Pandas. Cette méthode nous permet de calculer l'utilisation mémoire de chaque colonne dans un DataFrame. Nous pouvons inclure ou exclure l'index du calcul d'utilisation mémoire selon nos besoins, et également obtenir la consommation mémoire globale des colonnes d'un DataFrame. Comprendre l'utilisation mémoire d'un DataFrame peut aider à optimiser notre code et à améliorer les performances.