Pandas DataFrame Iterrows-Methode

Beginner

Einführung

In diesem Lab werden wir die Python Pandas DataFrame.iterrows()-Methode untersuchen. Diese Methode ermöglicht es uns, über die Zeilen eines Pandas DataFrames zu iterieren und gibt den Index und die Daten für jede Zeile zurück.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Erstellen eines DataFrames

Zunächst müssen wir ein DataFrame erstellen, mit dem wir arbeiten können. Erstellen wir ein einfaches DataFrame mit der Pandas-Bibliothek.

#importing pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['id001', 'id002'])

Iterieren über Zeilen mit der iterrows()-Methode

Um über die Zeilen des DataFrames zu iterieren, können wir die iterrows()-Methode verwenden. Diese Methode gibt ein Generator-Objekt zurück, das ein Tupel aus dem Index und den Daten für jede Zeile enthält.

#print the DataFrame
print("The DataFrame is:")
print(df)

#print the generator object
print("Iterate over rows:")
print(df.iterrows())

Verwenden einer for-Schleife, um auf die Zeilen zuzugreifen

Um auf den Index und die Daten für jede Zeile zuzugreifen, können wir eine for-Schleife verwenden. Die Zeilendaten können über die Variable row_data und der Index über die Variable row_index zugegriffen werden.

#for loop to iterate over rows
print("Iterate over rows:")
for row_index, row_data in df.iterrows():
    print("Index:", row_index)
    print("Data:", row_data)

Zugang zu spezifischen Daten aus einer Zeile

Wir können auch auf spezifische Daten in einer Zeile zugreifen, indem wir die Zeilennummer angeben. Drucken wir den Wert der Spalte "Name" für jede Zeile.

#for loop to access the "Name" column for each row
print("Accessing specific data:")
for row_index, row_data in df.iterrows():
    print("Name:", row_data['Name'])

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die iterrows()-Methode in Pandas verwendet, um über die Zeilen eines DataFrames zu iterieren. Wir haben untersucht, wie man über die for-Schleife auf den Index und die Daten für jede Zeile zugreift und wie man auf spezifische Daten in einer Zeile zugreift. Die iterrows()-Methode ist ein nützliches Werkzeug zur Analyse und Manipulation von Daten in einem DataFrame.