Pandas DataFrame Apply-Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir lernen, wie man die apply()-Methode in der Pandas-Bibliothek für Python verwendet. Die apply()-Methode ermöglicht es uns, eine Funktion auf jede Zeile oder Spalte eines DataFrames anzuwenden, und sie ist nützlich für die Durchführung von Berechnungen oder Transformationen auf unseren Daten.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken

Um zu beginnen, müssen wir die Pandas-Bibliothek importieren, die das DataFrame-Objekt und die apply()-Methode bereitstellt. Wir können auch andere Bibliotheken importieren, wenn sie für unsere Berechnungen erforderlich sind.

import pandas as pd

Erstellen eines DataFrames

Als nächstes erstellen wir ein DataFrame, mit dem wir arbeiten können. Wir können die Daten mithilfe einer Python-Liste oder eines Wörterbuchs definieren. Für die Einfachheit nutzen wir ein Wörterbuch, wobei die Schlüssel die Spaltennamen und die Werte die Daten darstellen.

data = {
    'Name': ['John', 'Emma', 'David', 'Mary'],
    'Age': [25, 30, 35, 40],
    'Salary': [50000, 60000, 70000, 80000]
}
df = pd.DataFrame(data)
print(df)

Definieren einer Funktion

Nun definieren wir eine Funktion, die wir auf unser DataFrame anwenden können. Diese Funktion wird einen einzelnen Parameter entgegennehmen, der eine Zeile oder eine Spalte des DataFrames sein wird.

def double(x):
    return x * 2

Anwenden der Funktion auf eine Spalte

Wir können die apply()-Methode verwenden, um unsere definierte Funktion auf eine Spalte des DataFrames anzuwenden. In diesem Beispiel wenden wir die double()-Funktion auf die 'Salary'-Spalte an.

df['Salary'] = df['Salary'].apply(double)
print(df)

Anwenden der Funktion auf eine Zeile

Wir können unsere Funktion auch auf eine Zeile des DataFrames anwenden, indem wir axis=1 in der apply()-Methode angeben. In diesem Beispiel wenden wir die double()-Funktion auf jede Zeile des DataFrames an.

df = df.apply(double, axis=1)
print(df)

Anwenden einer Lambda-Funktion

Anstatt eine separate Funktion zu definieren, können wir eine Lambda-Funktion direkt in der apply()-Methode verwenden. Eine Lambda-Funktion ist eine kleine anonyme Funktion, die beliebig viele Argumente entgegennehmen und ein Ergebnis zurückgeben kann. In diesem Beispiel wenden wir eine Lambda-Funktion auf die 'Age'-Spalte an, um das Quadrat jedes Werts zu berechnen.

df['Age'] = df['Age'].apply(lambda x: x ** 2)
print(df)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die apply()-Methode in Pandas verwendet, um eine Funktion auf jede Zeile oder Spalte eines DataFrames anzuwenden. Wir haben gesehen, wie man eine Funktion definiert und auf eine Spalte oder Zeile anwendet, sowie wie man eine Lambda-Funktion direkt in der apply()-Methode verwendet. Die apply()-Methode ist ein leistungsstarkes Werkzeug zur Durchführung von Berechnungen oder Transformationen auf unseren Daten und kann dazu beitragen, unsere Datenanalyseaufgaben zu vereinfachen.