Método DataFrame.nunique() de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos sobre el método DataFrame.nunique() de pandas de Python. Este método se utiliza para contar el número de observaciones distintas o únicas en un DataFrame de pandas.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no puede automatizarse debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar la biblioteca pandas

Antes de comenzar, debemos importar la biblioteca pandas, que se utiliza para la manipulación y análisis de datos. La podemos importar con el siguiente código:

import pandas as pd

Crear un DataFrame

Vamos a crear un DataFrame de ejemplo con el que trabajar. Utilizaremos la función pd.DataFrame() para crear un DataFrame con tres columnas, A, B y C, y tres filas de datos. Cada columna tendrá algunos valores duplicados.

df = pd.DataFrame({'A': [1, 2, 3], 'B': [1, 1, 1], 'C': [2, 5, 5]})

Contar valores únicos en el DataFrame

Ahora, vamos a utilizar el método DataFrame.nunique() para contar el número de valores únicos en el DataFrame. Podemos especificar el parámetro axis como "0" para contar valores únicos sobre el eje del índice (columnas), o "1" para contar valores únicos sobre el eje de las columnas (filas).

print("Número de valores únicos en cada columna:")
print(df.nunique(axis=0))

print("Número de valores únicos en cada fila:")
print(df.nunique(axis=1))

Manejar valores nulos

Por defecto, el método DataFrame.nunique() no incluye los valores nulos en los conteos. Si una columna contiene valores nulos, se contará como "0". Vamos a crear otro DataFrame con algunos valores nulos y contar nuevamente los valores únicos.

df = pd.DataFrame({'A': [1, None, 3], 'B': [1, None, 1], 'C': [2, None, 5]})

Contar valores únicos con valores nulos

Vamos a contar los valores únicos en este nuevo DataFrame, incluyendo los valores nulos.

print("Número de valores únicos en cada fila con valores nulos:")
print(df.nunique(axis=1))

Resumen

En este laboratorio, aprendimos cómo utilizar el método DataFrame.nunique() en pandas para contar el número de valores únicos en un DataFrame. También aprendimos cómo manejar valores nulos y contar valores únicos incluyendo los valores nulos. Este método es útil para analizar conjuntos de datos y comprender la distribución de valores en un DataFrame.