Einführung
In diesem Lab lernst du, wie du die agg()-Methode in der pandas-Bibliothek zum Aggregieren von Daten in einem DataFrame verwendest. Diese Methode ermöglicht es dir, eine oder mehrere Operationen auf einer angegebenen Achse, wie Zeilen oder Spalten, durchzuführen und gibt einen Skalar, eine Series oder ein DataFrame basierend auf der gewählten Funktion zurück.
Tipps für die VM
Nachdem der VM-Start abgeschlossen ist, klicke in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.
Manchmal musst du einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Operationen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn du bei der Lernphase Probleme hast, kannst du Labby gerne fragen. Gib nach der Sitzung Feedback, und wir werden das Problem für dich prompt beheben.
Importiere die pandas-Bibliothek
Zunächst musst du die pandas-Bibliothek mit dem import-Statement importieren:
import pandas as pd
Erstelle ein DataFrame
Als nächstes erstelle einen DataFrame-Objekt, mit dem du arbeiten kannst. Du kannst die pd.DataFrame()-Funktion verwenden, um einen DataFrame aus einer Liste oder einem Array zu erstellen. Hier ist ein Beispiel:
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=['A', 'B', 'C'])
Aggregieren eines DataFrames mit einer einzelnen Funktion über die Zeilen
Um das DataFrame mit einer einzelnen Funktion zu aggregieren, kannst du die agg()-Methode verwenden. Gib die Funktion an, die du auf die Zeilen anwenden möchtest, entweder als String-Funktionsname oder als Funktionsobjekt an. Hier ist ein Beispiel:
print("Printing the sum of values in DataFrame")
print(df.agg(["sum"]))
Aggregieren eines DataFrames mit einer einzelnen Funktion über die Spalten
Um das DataFrame mit einer einzelnen Funktion über die Spalten zu aggregieren, setze den axis-Parameter auf 'columns'. Dadurch wird die Funktion auf jede Spalte anstatt auf jede Zeile angewendet. Hier ist ein Beispiel:
print("Printing the minimum value in DataFrame")
print(df.agg(["min"], axis='columns'))
Aggregieren eines DataFrames mit einer Liste von Funktionen über die Zeilen und Spalten
Du kannst auch das DataFrame mit einer Liste von Funktionen aggregieren. Dadurch kannst du mehrere Operationen auf den Zeilen oder Spalten ausführen. Hier ist ein Beispiel:
print("Printing sum and min of the DataFrame with default axis")
print(df.agg(["sum", "min"]))
Aggregieren eines DataFrames mit verschiedenen Funktionen über die Spalten
Für mehr Flexibilität kannst du ein Dictionary von Spaltennamen und entsprechenden Funktionen an die agg()-Methode übergeben. Dadurch kannst du verschiedene Funktionen auf verschiedene Spalten anwenden. Hier ist ein Beispiel:
print("Printing different aggregation functions over the columns")
print(df.agg({'A': ["sum"], 'B': ["min", "max"], 'C': ["count"]}))
Zusammenfassung
In diesem Lab hast du gelernt, wie du die agg()-Methode in pandas verwendest, um Daten in einem DataFrame zu aggregieren. Du weißt jetzt, wie du einzelne und mehrere Funktionen über die Zeilen und Spalten des DataFrames anwenden kannst. Diese Methode ist nützlich, um verschiedene Aggregationsoperationen auf deine Daten durchzuführen. Experimentiere mit verschiedenen Funktionen und Achsen, um dein DataFrame zu analysieren und zu zusammenfassen. Viel Spaß beim Analysieren!