Método apply() en DataFrame de Pandas

Beginner

Introducción

En este laboratorio, aprenderemos a usar el método apply() de la biblioteca Pandas para Python. El método apply() nos permite aplicar una función a cada fila o columna de un DataFrame, y es útil para realizar cálculos o transformaciones en nuestros datos.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no puede automatizarse debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos el problema para usted de inmediato.

Importar las bibliotecas necesarias

Para comenzar, necesitamos importar la biblioteca Pandas, que proporciona el objeto DataFrame y el método apply(). También podemos importar otras bibliotecas si son necesarias para nuestros cálculos.

import pandas as pd

Crear un DataFrame

A continuación, creemos un DataFrame con el que trabajar. Podemos definir los datos utilizando una lista de Python o un diccionario. Para simplificar, usemos un diccionario donde las claves representan los nombres de las columnas y los valores representan los datos.

data = {
    'Name': ['John', 'Emma', 'David', 'Mary'],
    'Age': [25, 30, 35, 40],
    'Salary': [50000, 60000, 70000, 80000]
}
df = pd.DataFrame(data)
print(df)

Definir una función

Ahora, definamos una función que podamos aplicar a nuestro DataFrame. Esta función tomará un solo parámetro, que será una fila o una columna del DataFrame.

def double(x):
    return x * 2

Aplicar la función a una columna

Podemos usar el método apply() para aplicar la función que definimos a una columna del DataFrame. En este ejemplo, apliquemos la función double() a la columna 'Salary'.

df['Salary'] = df['Salary'].apply(double)
print(df)

Aplicar la función a una fila

También podemos aplicar nuestra función a una fila del DataFrame especificando axis=1 en el método apply(). En este ejemplo, apliquemos la función double() a cada fila del DataFrame.

df = df.apply(double, axis=1)
print(df)

Aplicar una función lambda

En lugar de definir una función separada, podemos usar una función lambda en línea con el método apply(). Una función lambda es una función anónima pequeña que puede tomar cualquier número de argumentos y devolver un resultado. En este ejemplo, apliquemos una función lambda a la columna 'Age' para calcular el cuadrado de cada valor.

df['Age'] = df['Age'].apply(lambda x: x ** 2)
print(df)

Resumen

En este laboratorio, aprendimos cómo usar el método apply() en Pandas para aplicar una función a cada fila o columna de un DataFrame. Vimos cómo definir una función y aplicarla a una columna o una fila, así como cómo usar una función lambda en línea con el método apply(). El método apply() es una herramienta poderosa para realizar cálculos o transformaciones en nuestros datos, y puede ayudar a simplificar nuestras tareas de análisis de datos.