Pandas DataFrame Agg-Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab lernst du, wie du die agg()-Methode in der pandas-Bibliothek zum Aggregieren von Daten in einem DataFrame verwendest. Diese Methode ermöglicht es dir, eine oder mehrere Operationen auf einer angegebenen Achse, wie Zeilen oder Spalten, durchzuführen und gibt einen Skalar, eine Series oder ein DataFrame basierend auf der gewählten Funktion zurück.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicke in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal musst du einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Operationen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn du bei der Lernphase Probleme hast, kannst du Labby gerne fragen. Gib nach der Sitzung Feedback, und wir werden das Problem für dich prompt beheben.

Importiere die pandas-Bibliothek

Zunächst musst du die pandas-Bibliothek mit dem import-Statement importieren:

import pandas as pd

Erstelle einen DataFrame

Als nächstes erstelle einen DataFrame-Objekt, mit dem du arbeiten kannst. Du kannst die pd.DataFrame()-Funktion verwenden, um einen DataFrame aus einer Liste oder einem Array zu erstellen. Hier ist ein Beispiel:

df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=['A', 'B', 'C'])

Aggregieren eines DataFrames mit einer einzelnen Funktion über die Zeilen

Um das DataFrame mit einer einzelnen Funktion zu aggregieren, kannst du die agg()-Methode verwenden. Gib die Funktion an, die du auf die Zeilen anwenden möchtest, entweder als String-Funktionsname oder als Funktionsobjekt an. Hier ist ein Beispiel:

print("Printing the sum of values in DataFrame")
print(df.agg(["sum"]))

Aggregieren eines DataFrames mit einer einzelnen Funktion über die Spalten

Um das DataFrame mit einer einzelnen Funktion über die Spalten zu aggregieren, setze den axis-Parameter auf 'columns'. Dadurch wird die Funktion auf jede Spalte anstatt auf jede Zeile angewendet. Hier ist ein Beispiel:

print("Printing the minimum value in DataFrame")
print(df.agg(["min"], axis='columns'))

Aggregieren eines DataFrames mit einer Liste von Funktionen über die Zeilen und Spalten

Du kannst auch das DataFrame mit einer Liste von Funktionen aggregieren. Dadurch kannst du mehrere Operationen auf den Zeilen oder Spalten ausführen. Hier ist ein Beispiel:

print("Printing sum and min of the DataFrame with default axis")
print(df.agg(["sum", "min"]))

Aggregieren eines DataFrames mit unterschiedlichen Funktionen über die Spalten

Für mehr Flexibilität kannst du ein Dictionary von Spaltennamen und entsprechenden Funktionen an die agg()-Methode übergeben. Dadurch kannst du verschiedene Funktionen auf verschiedene Spalten anwenden. Hier ist ein Beispiel:

print("Printing different aggregation functions over the columns")
print(df.agg({'A': ["sum"], 'B': ["min", "max"], 'C': ["count"]}))

Zusammenfassung

In diesem Lab hast du gelernt, wie du die agg()-Methode in pandas verwendest, um Daten in einem DataFrame zu aggregieren. Du weißt jetzt, wie du einzelne und mehrere Funktionen über die Zeilen und Spalten des DataFrames anwenden kannst. Diese Methode ist nützlich, um verschiedene Aggregationsoperationen auf deine Daten durchzuführen. Experimentiere mit verschiedenen Funktionen und Achsen, um dein DataFrame zu analysieren und zu zusammenfassen. Viel Spaß beim Analysieren!