Método dropna de DataFrame de Pandas

Beginner

Introducción

En este laboratorio, aprenderemos sobre el método dropna() de pandas para DataFrame. Este método se utiliza para eliminar valores faltantes de un DataFrame eliminando filas o columnas que contengan valores nulos o NaN.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos rápidamente el problema para usted.

Importar la biblioteca pandas

Antes de comenzar, necesitamos importar la biblioteca pandas. Usaremos el alias pd para esta biblioteca.

import pandas as pd

Crear un DataFrame

Vamos a crear un DataFrame que contenga algunos valores faltantes.

df = pd.DataFrame([
    ['Abhishek', 100, 'Science', None],
    ['Anurag', 101, 'Science', 85],
    ['Chetan', 103, 'Maths', None]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

Usar el método dropna() para eliminar filas con valores faltantes

Podemos utilizar el método dropna() para eliminar las filas que contienen valores faltantes. Por defecto, elimina cualquier fila que tenga al menos un valor nulo o NaN.

df_dropped = df.dropna()

Mostrar el resultado

Vamos a imprimir el DataFrame original y el DataFrame resultante después de eliminar las filas con valores faltantes.

print("Original DataFrame:")
print(df)

print("DataFrame after dropping rows with missing values:")
print(df_dropped)

Resumen

En este laboratorio, aprendimos sobre el método dropna() de pandas para DataFrame, que se utiliza para eliminar filas o columnas con valores faltantes. Al eliminar estos valores faltantes, podemos limpiar nuestro DataFrame y hacerlo adecuado para un análisis ulterior. Recuerda que este método modifica el DataFrame y devuelve un nuevo DataFrame por defecto, pero también podemos elegir modificar el DataFrame en su lugar estableciendo el parámetro inplace en True.