Método iterrows() de DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, exploraremos el método DataFrame.iterrows() de Python Pandas. Este método nos permite iterar sobre las filas de un DataFrame de Pandas, devolviendo el índice y los datos de cada fila.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y lo resolveremos rápidamente para usted.

Crear un DataFrame

Primero, necesitamos crear un DataFrame con el que trabajar. Vamos a crear un DataFrame simple utilizando la biblioteca Pandas.

#importing pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['id001', 'id002'])

Iterar sobre las filas utilizando el método iterrows()

Para iterar sobre las filas del DataFrame, podemos utilizar el método iterrows(). Este método devuelve un objeto generador que contiene una tupla con el índice y los datos de cada fila.

#print the DataFrame
print("The DataFrame is:")
print(df)

#print the generator object
print("Iterate over rows:")
print(df.iterrows())

Utilizar un bucle for para acceder a las filas

Para acceder al índice y los datos de cada fila, podemos utilizar un bucle for. Los datos de la fila se pueden acceder utilizando la variable row_data, y el índice se puede acceder utilizando la variable row_index.

#for loop to iterate over rows
print("Iterate over rows:")
for row_index, row_data in df.iterrows():
    print("Index:", row_index)
    print("Data:", row_data)

Accediendo a datos específicos de una fila

También podemos acceder a un dato específico de una fila especificando el número de índice. Imprimamos el valor de la columna "Name" para cada fila.

#for loop to access the "Name" column for each row
print("Accessing specific data:")
for row_index, row_data in df.iterrows():
    print("Name:", row_data['Name'])

Resumen

En este laboratorio, aprendimos cómo utilizar el método iterrows() en Pandas para iterar sobre las filas de un DataFrame. Exploramos cómo acceder al índice y los datos de cada fila utilizando un bucle for, y cómo acceder a datos específicos de una fila. El método iterrows() es una herramienta útil para analizar y manipular datos en un DataFrame.