Método DataFrame.itertuples() de Pandas

PandasPandasBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos sobre el método DataFrame.iteruples() de Python Pandas. El método iteruples() en Pandas itera sobre las filas de un DataFrame y devuelve cada fila como un tupla con nombre. Es un método útil para iterar y trabajar con las filas de un DataFrame.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos rápidamente el problema para usted.

Comprender la sintaxis

La sintaxis del método iteruples() es la siguiente:

DataFrame.iteruples(index=True, name='Pandas')
  • index: Es un valor booleano que indica si se debe incluir el índice como el primer elemento de la tupla. El valor predeterminado es True.
  • name: Es un valor de cadena que representa el nombre de las tuplas con nombre devueltas. El valor predeterminado es "Pandas". Si se establece en None, se devuelven tuplas regulares en lugar de tuplas con nombre.

Iterar sobre las filas de un DataFrame

En este paso, crearemos un DataFrame y usaremos el método iteruples() para iterar sobre sus filas. El método devuelve un objeto de mapa, que se puede usar en un bucle para iterar sobre cada fila como una tupla con nombre.

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows
for row in df.iteruples():
    print(row)

Controlar el índice y el nombre de la tupla

En este paso, exploraremos cómo controlar el índice y el nombre de las tuplas devueltas. Por defecto, el índice se incluye como el primer elemento de la tupla y las tuplas se llaman "Pandas". Podemos modificar estos ajustes pasando argumentos al método iteruples().

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows without index and custom name
for row in df.iteruples(index=False, name='Rows'):
    print(row)

Resumen

En este laboratorio, aprendimos sobre el método DataFrame.iteruples() de Pandas, que es útil para iterar sobre las filas de un DataFrame y acceder a los valores de cada fila. Vimos cómo usar el método, controlar la inclusión del índice y personalizar el nombre de las tuplas devueltas. Este método puede ser útil en varias tareas de análisis y manipulación de datos con DataFrames de Pandas.