Méthode d'utilisation mémoire du DataFrame Pandas

Beginner

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode DataFrame.memory_usage() de Pandas en Python. Cette méthode nous permet de calculer l'utilisation mémoire de chaque colonne dans un DataFrame. Nous allons suivre des instructions étape par étape sur la manière d'utiliser cette méthode avec des exemples.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importer les bibliothèques nécessaires et créer un DataFrame

  • Avant de commencer, importons la bibliothèque pandas et créons un DataFrame.
  • Créez un DataFrame avec quelques données d'échantillonnage.
## Import pandas library
import pandas as pd

## Create a DataFrame
df = pd.DataFrame({'Name': ['Abhishek', 'Anurag', 'Divya'],
                   'Roll No': [100, 101, 104]})

Afficher le DataFrame et calculer l'utilisation mémoire

  • Maintenant, voyons le DataFrame créé et calculons son utilisation mémoire en utilisant la méthode DataFrame.memory_usage().
## View the DataFrame
print("----------Le DataFrame est---------")
print(df)
print("-----------------------------------")

## Calculate memory usage
print(df.memory_usage())

Exclure l'index du calcul d'utilisation mémoire

  • Par défaut, la méthode DataFrame.memory_usage() inclut l'utilisation mémoire de l'index du DataFrame. Si nous voulons exclure l'index du calcul de l'utilisation mémoire, nous pouvons définir le paramètre index sur False.
## Calculate memory usage excluding index
print(df.memory_usage(index=False))

Obtenir la consommation mémoire globale

  • Nous pouvons également obtenir la consommation mémoire globale des colonnes d'un DataFrame en utilisant la méthode DataFrame.memory_usage() ainsi que la fonction sum().
## Obtenez la consommation mémoire globale
print(df.memory_usage(index=False).sum())

Résumé

Dans ce laboratoire, nous avons appris à utiliser la méthode DataFrame.memory_usage() dans Python Pandas. Cette méthode nous permet de calculer l'utilisation mémoire de chaque colonne dans un DataFrame. Nous pouvons inclure ou exclure l'index du calcul d'utilisation mémoire selon nos besoins, et également obtenir la consommation mémoire globale des colonnes d'un DataFrame. Comprendre l'utilisation mémoire d'un DataFrame peut aider à optimiser notre code et à améliorer les performances.