Pandas DataFrame Speicherbedarfs-Methode

Beginner

Einführung

In diesem Lab werden wir lernen, wie man die DataFrame.memory_usage()-Methode in Python Pandas verwendet. Diese Methode ermöglicht es uns, die Speicherbedarf jeder Spalte in einem DataFrame zu berechnen. Wir werden Schritt-für-Schritt-Anleitungen mit Beispielen kennenlernen, wie man diese Methode einsetzt.

Tipps für die virtuelle Maschine

Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der linken oberen Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.

Importiere die erforderlichen Bibliotheken und erstelle einen DataFrame

  • Bevor wir beginnen, importieren wir die pandas-Bibliothek und erstellen ein DataFrame.
  • Erstellen Sie ein DataFrame mit einigen Beispiel-Daten.
## Import pandas library
import pandas as pd

## Create a DataFrame
df = pd.DataFrame({'Name': ['Abhishek', 'Anurag', 'Divya'],
                   'Roll No': [100, 101, 104]})

Betrachte den DataFrame und berechne den Speicherbedarf

  • Lassen Sie uns nun das erstellte DataFrame anzeigen und seinen Speicherbedarf mit der DataFrame.memory_usage()-Methode berechnen.
## View the DataFrame
print("----------The DataFrame is---------")
print(df)
print("-----------------------------------")

## Calculate memory usage
print(df.memory_usage())

Index bei der Speicherbedarfsberechnung ausschließen

  • Standardmäßig umfasst die DataFrame.memory_usage()-Methode den Speicherbedarf durch den Index des DataFrames. Wenn wir den Index von der Speicherbedarfsberechnung ausschließen möchten, können wir den index-Parameter auf False setzen.
## Calculate memory usage excluding index
print(df.memory_usage(index=False))

Den Gesamt-Speicherverbrauch ermitteln

  • Wir können auch den Gesamten Speicherbedarf der Spalten eines DataFrames ermitteln, indem wir die DataFrame.memory_usage()-Methode zusammen mit der sum()-Funktion verwenden.
## Get overall memory consumption
print(df.memory_usage(index=False).sum())

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die DataFrame.memory_usage()-Methode in Python Pandas verwendet. Diese Methode ermöglicht es uns, den Speicherbedarf jeder Spalte in einem DataFrame zu berechnen. Wir können den Index bei der Speicherbedarfsberechnung je nach Bedarf einbeziehen oder ausschließen und auch den Gesamten Speicherbedarf der DataFrame-Spalten ermitteln. Das Verständnis des Speicherbedarfs eines DataFrames kann dazu beitragen, unseren Code zu optimieren und die Leistung zu verbessern.