Pandas DataFrame Pivot Table Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir die pivot_table()-Methode in der Python pandas-Bibliothek kennenlernen. Die pivot_table()-Methode wird verwendet, um Daten in einem DataFrame zu aggregieren und zu summarieren. Sie gibt eine tabellenartige Pivot-Tabelle als neues DataFrame zurück.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken und Erstellen des DataFrames

Zunächst importieren wir die pandas-Bibliothek und erstellen einen DataFrame mit einigen Beispiel-Daten. Wir werden einen DataFrame mit den Spalten 'Date' (Datum), 'State' (Bundesstaat), 'Temperature' (Temperatur) und 'Humidity' (Luftfeuchtigkeit) erstellen.

import pandas as pd

df = pd.DataFrame({'Date': ['1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021', '1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021'],
                   'State': ['Karnataka', 'Karnataka', 'Karnataka', 'Karnataka', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu'],
                   'Temperature': [25, 29, 28, 31, 26, 27, 22, 32],
                   'Humidity': [46, 50, 52, 59, 42, 45, 46, 43]})

Aggregieren des DataFrames mit der pivot_table()-Methode

Um die Daten im DataFrame mit der pivot_table()-Methode zu aggregieren, müssen wir die Spalten angeben, die wir als Indizes, Spalten und die Werte verwenden möchten, die wir aggregieren möchten.

pivot_df = df.pivot_table(index='Date', columns='State', aggfunc='mean')

Zeigen des resultierenden DataFrames

Schließlich zeigen wir das resultierende pivot table DataFrame an.

print(pivot_df)

Zusammenfassung

Indem wir diese Schritte befolgen, konnten wir die pivot_table()-Methode in der pandas-Bibliothek verwenden, um Daten in einem DataFrame zu aggregieren und zu summarisieren. Diese Methode ist nützlich für die Analyse und Visualisierung von Daten in tabellarischer Form. Das resultierende pivot table DataFrame bietet eine bequeme Möglichkeit, die aggregierten Werte basierend auf verschiedenen Indizes und Spalten zu sehen.