Método DataFrame.isnull() de Pandas

PandasPandasBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos a usar el método DataFrame.isnull() de pandas. Este método se utiliza para detectar valores nulos en un DataFrame. Al aplicar este método a un DataFrame, devuelve un DataFrame de valores booleanos, donde True indica que el elemento es un valor nulo y False indica que el elemento no es un valor nulo. Es importante tener en cuenta que este método no considera cadenas vacías o numpy.inf como valores nulos.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/BasicConceptsGroup(["Basic Concepts"]) pandas(("Pandas")) -.-> pandas/DataManipulationGroup(["Data Manipulation"]) pandas(("Pandas")) -.-> pandas/DataCleaningGroup(["Data Cleaning"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) python/BasicConceptsGroup -.-> python/booleans("Booleans") pandas/DataManipulationGroup -.-> pandas/change_data_types("Changing Data Types") pandas/DataCleaningGroup -.-> pandas/handle_missing_values("Handling Missing Values") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/PythonStandardLibraryGroup -.-> python/data_serialization("Data Serialization") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills python/booleans -.-> lab-68641{{"Método DataFrame.isnull() de Pandas"}} pandas/change_data_types -.-> lab-68641{{"Método DataFrame.isnull() de Pandas"}} pandas/handle_missing_values -.-> lab-68641{{"Método DataFrame.isnull() de Pandas"}} python/using_packages -.-> lab-68641{{"Método DataFrame.isnull() de Pandas"}} python/data_collections -.-> lab-68641{{"Método DataFrame.isnull() de Pandas"}} python/data_serialization -.-> lab-68641{{"Método DataFrame.isnull() de Pandas"}} python/data_analysis -.-> lab-68641{{"Método DataFrame.isnull() de Pandas"}} end

Crear un DataFrame

Comencemos creando un DataFrame con algunos valores faltantes. Usaremos la función pd.DataFrame de pandas y la constante np.nan de numpy.

## Importando pandas como pd
import pandas as pd
## Importando numpy como np
import numpy as np

## Creando el DataFrame
df = pd.DataFrame([(0.0, np.nan, -1.0, 1.0), (np.nan, 2.0, np.nan, np.nan), (2.0, 3.0, np.nan, 9.0)], columns=list('abcd'))

Esto creará un DataFrame con cuatro columnas ('a', 'b', 'c', 'd') y tres filas. El DataFrame contiene valores faltantes representados por np.nan.

Detectar valores faltantes

Ahora, usaremos el método DataFrame.isnull() para detectar los valores faltantes en el DataFrame.

## Detectando valores faltantes en el DataFrame
missing_values = df.isnull()

## Imprimiendo el DataFrame con valores faltantes
print(missing_values)

Esto devolverá un DataFrame que consta de valores booleanos para cada elemento en el DataFrame original. Los valores True indican que el elemento correspondiente es un valor faltante (np.nan), y los valores False indican que el elemento no es un valor faltante.

Considerar cadenas vacías como valores faltantes

Por defecto, el método DataFrame.isnull() no considera las cadenas vacías como valores faltantes. Si desea considerar las cadenas vacías como valores faltantes, puede reemplazarlas con np.nan antes de usar el método.

## Reemplazando cadenas vacías con np.nan
df = df.replace('', np.nan)

## Detectando valores faltantes en el DataFrame
missing_values = df.isnull()

## Imprimiendo el DataFrame con valores faltantes
print(missing_values)

Ahora esto considerará las cadenas vacías como valores faltantes y devolverá un DataFrame con valores booleanos que indican la presencia de valores faltantes.

Resumen

En este laboratorio, aprendimos a usar el método DataFrame.isnull() de pandas para detectar valores faltantes en un DataFrame. Vimos que devuelve un DataFrame de valores booleanos, donde True indica un valor faltante y False indica un valor no faltante. También vimos que, por defecto, las cadenas vacías no se consideran valores faltantes, pero pueden tratarse como valores faltantes reemplazándolas con np.nan antes de usar el método. Este método es útil para tareas de limpieza y preprocesamiento de datos en proyectos de análisis de datos y aprendizaje automático.