Pandas DataFrame Pivot-Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir lernen, wie man die pivot()-Methode in der Python-Pandas-Bibliothek verwendet. Die pivot()-Methode ermöglicht es uns, einen DataFrame zu transformieren oder umzuformen, indem wir die Organisation der Index- und Spaltenwerte ändern.

Tipps für die virtuelle Maschine (VM)

Nachdem die VM gestartet wurde, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und auf Jupyter Notebook für die Übung zuzugreifen.

Manchmal müssen Sie möglicherweise einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Operationen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie sich gerne an Labby wenden. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem umgehend für Sie lösen.

Importieren von pandas und Erstellen des DataFrames

  • Beginnen Sie damit, die pandas-Bibliothek zu importieren und einen DataFrame mit der Funktion pd.DataFrame() zu erstellen.
import pandas as pd

data = {
  'crop': ['Rice', 'Wheat', 'Rice', 'Wheat', 'Rice', 'Wheat'],
  'state': ['karnataka', 'karnataka', 'Tamilnadu', 'Tamilnadu', 'Kerala', 'Kerala'],
  'Temperature': [29, 29, 31, 31, 25, 25],
  'Humidity': [50, 50, 62, 62, 45, 45]
}

df = pd.DataFrame(data)
print(df)
  • Dadurch wird ein DataFrame mit Spalten für 'crop', 'state', 'Temperature' und 'Humidity' erstellt.

Umformen des DataFrames mit der pivot()-Methode

  • Um den DataFrame umzuformen, können wir die pivot()-Methode verwenden und die Index- und Spaltennamen angeben.
df_pivot = df.pivot(index='crop', columns='state')
print(df_pivot)
  • Die pivot()-Methode wird den DataFrame neu anordnen, wobei 'crop' als neuer Index und 'state' als neue Spalte verwendet wird. Der resultierende DataFrame wird 'Temperature' und 'Humidity' als Spalten für jede Kombination von 'crop' und 'state' haben.

Angeben des values-Parameters zur Auswahl bestimmter Spalten

  • Wenn wir nur bestimmte Spalten im umgeformten DataFrame einschließen möchten, können wir den values-Parameter in der pivot()-Methode verwenden.
df_pivot_specific = df.pivot(index='crop', columns='state', values='Temperature')
print(df_pivot_specific)
  • Der resultierende DataFrame wird nur die Spalte 'Temperature' für jede Kombination von 'crop' und 'state' enthalten.

Umgang mit Duplikaten im DataFrame

  • Wenn der DataFrame Duplikate enthält, wird die pivot()-Methode einen ValueError auslösen. In solchen Fällen müssen wir sicherstellen, dass der DataFrame keine doppelten Einträge hat, bevor wir ihn umformen.
df_duplicated = pd.DataFrame({'crop': ['Rice', 'Rice', 'Wheat', 'Wheat', 'Rice', 'Wheat'],
                              'state': ['karnataka', 'karnataka', 'Tamilnadu', 'Tamilnadu', 'Kerala', 'Kerala'],
                              'Temperature': [29, 29, 31, 31, 25, 25],
                              'Humidity': [50, 50, 62, 62, 45, 45]})

df_duplicated_pivot = df_duplicated.pivot(index='crop', columns='state', values='Temperature')
print(df_duplicated_pivot)
  • In diesem Beispiel enthält der DataFrame doppelte Einträge für die Kombination von 'crop' und 'state', was bei Verwendung der pivot()-Methode zu einem ValueError führt.

Zusammenfassung

In diesem Lab wurde die grundlegende Verwendung der pivot()-Methode in der Python-Pandas-Bibliothek behandelt. Die pivot()-Methode ermöglicht es uns, einen DataFrame zu transformieren oder umzuformen, indem wir die Organisation der Index- und Spaltenwerte ändern. Wir haben gelernt, wie man einen DataFrame umformt, bestimmte Spalten auswählt und Duplikate behandelt. Die pivot()-Methode ist ein leistungsstarkes Werkzeug für die Datenmanipulation und -analyse.