Pandas DataFrame Groupby Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir lernen, wie die groupby()-Methode in der Pandas-Bibliothek in Python verwendet wird. Die groupby()-Methode ermöglicht es uns, einen DataFrame in Gruppen aufzuteilen und Berechnungen oder Statistiken für jede Gruppe durchzuführen. Es ist ein leistungsstarkes Tool zur Datenanalyse und -manipulation.

VM-Tipps

Nachdem die VM gestartet ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken und Erstellen des DataFrames

Zunächst müssen wir die Pandas-Bibliothek importieren und ein DataFrame-Objekt erstellen. Hier ist ein Beispiel:

import pandas as pd

data = {'Name': ['Avinash', 'Amrutha', 'Chetana', 'Kartik','Nikhil'],
        'Percentage': [72, 98, 81, 87,85],
        'Course': ['Arts','B.Com','M.Tech','B.SC','BE']}

df = pd.DataFrame(data)

Gruppieren des DataFrames nach einer einzelnen Spalte

Um den DataFrame nach einer einzelnen Spalte zu gruppieren, verwenden Sie die groupby()-Methode und geben den Spaltennamen als Argument an. Hier ist ein Beispiel:

grp = df.groupby('Course')

Zugang zu den Gruppen

Um auf die Gruppen im gruppierten DataFrame zuzugreifen, verwenden Sie das Attribut groups. Es gibt ein Dictionary zurück, wobei die Schlüssel die Gruppennamen sind und die Werte die entsprechenden Indizes der Zeilen in jeder Gruppe. Hier ist ein Beispiel:

print(grp.groups)

Gruppieren des DataFrames nach mehreren Spalten

Um den DataFrame nach mehreren Spalten zu gruppieren, übergeben Sie eine Liste von Spaltennamen an die groupby()-Methode. Hier ist ein Beispiel:

grp = df.groupby(['Course', 'Name'])

Wählen Sie eine einzelne Gruppe aus

Um eine einzelne Gruppe aus dem gruppierten DataFrame auszuwählen, verwenden Sie die get_group()-Methode und geben den Gruppennamen als Argument an. Hier ist ein Beispiel:

print(grp.get_group(('Arts', 'Avinash')))

Führen Sie Aggregationsoperationen durch

Wenn Sie einen gruppierten DataFrame haben, können Sie Aggregationsoperationen auf den gruppierten Daten ausführen. Beispielsweise können Sie den Mittelwert einer numerischen Spalte für jede Gruppe berechnen. Hier ist ein Beispiel:

print(grp['Percentage'].mean())

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die groupby()-Methode in der Pandas-Bibliothek verwendet, um einen DataFrame nach einer oder mehreren Spalten zu gruppieren. Wir haben auch gelernt, wie man auf die Gruppen zugreift, eine einzelne Gruppe auswählt und Aggregationsoperationen auf den gruppierten Daten durchführt. Die groupby()-Methode ist ein leistungsstarkes Werkzeug für die Datenanalyse und -manipulation, das es uns ermöglicht, durch die gruppierte Analyse unserer Daten tiefere Einblicke zu gewinnen.