Pandas DataFrame Info Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

Die info()-Methode in der Python-Pandas-Bibliothek wird verwendet, um einen Überblick über einen DataFrame zu erhalten. Sie liefert wertvolle Informationen über den DataFrame, einschließlich des Index-Datentyps und der Spalten, nicht-leerer Werte und der Speicherauslastung.

Tipps für die virtuelle Maschine

Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der linken oberen Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken

Zunächst müssen wir die pandas-Bibliothek importieren, die eine leistungsstarke Datenmanipulationsbibliothek in Python ist.

import pandas as pd

Erstellen eines DataFrames

Als nächstes müssen wir einen DataFrame erstellen. Dies können wir tun, indem wir die Funktion pd.DataFrame() verwenden und ein Wörterbuch mit Daten übergeben.

int_values = [1, 2, 3, 4, 5]
text_values = ['alpha', 'beta', 'gamma', 'delta', 'epsilon']
float_values = [0.0, 0.25, 0.5, 0.75, 1.0]
df = pd.DataFrame({"int_col": int_values, "text_col": text_values, "float_col": float_values})

Verwenden der info()-Methode

Jetzt, nachdem wir unseren DataFrame haben, können wir die info()-Methode verwenden, um die Zusammenfassungsinformationen zu erhalten. Standardmäßig druckt die info()-Methode die vollständige Zusammenfassung des DataFrames.

df.info()

Analysieren der Ausgabe

Nachdem Sie den Code ausgeführt haben, sehen Sie die Zusammenfassungsinformationen zum DataFrame, einschließlich des Datentyps jeder Spalte, der Anzahl der nicht-leeren Werte und der Speicherauslastung. Hier ist ein Beispiel für die Ausgabe:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5 entries, 0 to 4
Data columns (total 3 columns):
 ##   Column    Non-Null Count  Dtype
---  ------    --------------  -----
 0   int_col   5 non-null      int64
 1   text_col  5 non-null      object
 2   float_col 5 non-null      float64
dtypes: float64(1), int64(1), object(1)
memory usage: 248.0+ bytes

Zusammenfassung

Die info()-Methode in der Python-Pandas-Bibliothek ist eine nützliche Methode, um eine schnelle Zusammenfassung eines DataFrames zu erhalten. Sie liefert Informationen über den Index-Datentyp und die Spalten, nicht-leere Werte und die Speicherauslastung. Standardmäßig zeigt sie die vollständige Zusammenfassung an, aber Sie können auch die Parameter ändern, um die Ausgabe anzupassen. Diese Methode ist hilfreich, um die Struktur des DataFrames zu verstehen, insbesondere wenn es um große Datensätze geht. Mit den Informationen, die aus info() erhalten werden, können Sie fundierte Entscheidungen zur Datenbereinigung, -manipulation und -analyse treffen.