Método de inserción de DataFrame de Pandas

Beginner

Introducción

En este laboratorio, aprenderemos a usar el método DataFrame.insert() de la biblioteca pandas de Python. Este método nos permite insertar una columna en un DataFrame en una ubicación especificada. También podemos elegir si permitir columnas duplicadas o no.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar la biblioteca pandas

Comenzaremos importando la biblioteca pandas, que nos permitirá trabajar con DataFrames.

import pandas as pd

Crear un DataFrame

A continuación, creemos un DataFrame con el que trabajar. Para este ejemplo, crearemos un DataFrame con dos columnas, 'A' y 'B', y cuatro filas.

df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]})

Insertar una nueva columna en el DataFrame

Ahora, insertemos una nueva columna llamada 'C' en el índice 2 del DataFrame. Estableceremos el valor de esta columna en 1 para todas las filas.

df.insert(2, 'C', 1)

Imprimir el DataFrame

Para ver el DataFrame actualizado, imprímámolo usando la función print().

print(df)

Insertar una Serie como columna

Alternativamente, podemos insertar un objeto Serie como una columna en el DataFrame. Creemos un nuevo objeto Serie con los valores [1, 2, 3, 4] e insértelo en el índice 0 del DataFrame.

series = pd.Series([1, 2, 3, 4])
df.insert(0, 'C', series)

Imprimir el DataFrame

Una vez más, imprima el DataFrame para ver los cambios.

print(df)

Manejar columnas duplicadas

Por defecto, el método DataFrame.insert() lanza un ValueError si intentamos insertar una columna con una etiqueta que ya existe en el DataFrame. Sin embargo, podemos anular este comportamiento estableciendo allow_duplicates en True. Intentemos insertar una columna con una etiqueta duplicada y veamos el resultado.

df.insert(2, 'A', 1, allow_duplicates = True)

Imprimir el DataFrame

Después de intentar insertar la columna duplicada, imprima el DataFrame para ver el mensaje de error.

print(df)

Resumen

En este laboratorio, aprendimos cómo usar el método DataFrame.insert() en pandas para insertar nuevas columnas en un DataFrame en ubicaciones específicas. Aprendimos cómo insertar columnas con valores constantes y con objetos Serie. También vimos cómo manejar duplicados al insertar columnas. Este método es útil cuando necesitamos agregar nuevas características o modificar la estructura de nuestro DataFrame.