Método Nunique do DataFrame Pandas

Beginner

Introdução

Neste laboratório, aprenderemos sobre o método DataFrame.nunique() do pandas em Python. Este método é usado para contar o número de observações distintas ou únicas em um DataFrame do pandas.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar a biblioteca pandas

Antes de começarmos, precisamos importar a biblioteca pandas, que é usada para manipulação e análise de dados. Podemos importá-la usando o seguinte código:

import pandas as pd

Criar um DataFrame

Vamos criar um DataFrame de exemplo para trabalhar. Usaremos a função pd.DataFrame() para criar um DataFrame com três colunas, A, B e C, e três linhas de dados. Cada coluna terá alguns valores duplicados.

df = pd.DataFrame({'A': [1, 2, 3], 'B': [1, 1, 1], 'C': [2, 5, 5]})

Contar valores únicos no DataFrame

Agora, vamos usar o método DataFrame.nunique() para contar o número de valores únicos no DataFrame. Podemos especificar o parâmetro axis como "0" para contar valores únicos sobre o eixo do índice (colunas), ou "1" para contar valores únicos sobre o eixo das colunas (linhas).

print("Number of unique values in each column:")
print(df.nunique(axis=0))

print("Number of unique values in each row:")
print(df.nunique(axis=1))

Tratar valores nulos

Por padrão, o método DataFrame.nunique() não inclui valores nulos nas contagens. Se uma coluna contiver valores nulos, ela será contada como "0". Vamos criar outro DataFrame com alguns valores nulos e contar os valores únicos novamente.

df = pd.DataFrame({'A': [1, None, 3], 'B': [1, None, 1], 'C': [2, None, 5]})

Contar valores únicos, incluindo valores nulos

Vamos contar os valores únicos neste novo DataFrame, incluindo os valores nulos.

print("Number of unique values in each row with null values:")
print(df.nunique(axis=1))

Resumo

Neste laboratório, aprendemos como usar o método DataFrame.nunique() no pandas para contar o número de valores únicos em um DataFrame. Também aprendemos como lidar com valores nulos e contar valores únicos, incluindo os valores nulos. Este método é útil para analisar conjuntos de dados e entender a distribuição de valores em um DataFrame.