Método Mode em Pandas DataFrame

Beginner

Introdução

Este laboratório irá guiá-lo através do uso do método mode() em DataFrames Pandas. O método mode() é usado para encontrar o(s) valor(es) que ocorrem com mais frequência em um DataFrame.

Dicas da VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Primeiramente, importe a biblioteca Pandas usando a instrução import:

import pandas as pd

Criar um DataFrame

Agora, crie um DataFrame usando o construtor DataFrame(). Para este exemplo, vamos criar um DataFrame com três colunas: "A", "B" e "C".

df = pd.DataFrame({"A": [1, 2, 1], "B": [2, 2, 1], "C": [5, 2, 5]})

Encontrar o(s) valor(es) da moda

Para encontrar o(s) valor(es) da moda de cada coluna no DataFrame, use o método mode():

df_mode = df.mode()
print(df_mode)

O método mode() retorna um DataFrame contendo o(s) valor(es) da moda de cada coluna.

Especificar o eixo

Por padrão, o método mode() encontra o(s) valor(es) da moda ao longo do eixo da coluna (axis=0). Se você deseja encontrar o(s) valor(es) da moda ao longo do eixo da linha, especifique axis=1.

Por exemplo, para encontrar o(s) valor(es) da moda ao longo do eixo da linha, use o seguinte código:

df_mode = df.mode(axis=1)
print(df_mode)

Incluir apenas colunas numéricas

Se você deseja incluir apenas colunas numéricas no cálculo da moda, pode usar o parâmetro numeric_only. Por padrão, numeric_only está definido como False. Defina-o como True para incluir apenas colunas numéricas.

Por exemplo, para incluir apenas colunas numéricas no cálculo da moda, use o seguinte código:

df_mode = df.mode(numeric_only=True)
print(df_mode)

Incluir valores nulos

Por padrão, o método mode() não considera valores nulos. Se você deseja incluir valores nulos no cálculo da moda, pode usar o parâmetro dropna. Por padrão, dropna está definido como True. Defina-o como False para incluir valores nulos.

Por exemplo, para incluir valores nulos no cálculo da moda, use o seguinte código:

df_mode = df.mode(dropna=False)
print(df_mode)

Resumo

Neste laboratório, você aprendeu como usar o método mode() em um Pandas DataFrame para encontrar o(s) valor(es) que ocorrem com mais frequência. Você também aprendeu como especificar o eixo, incluir apenas colunas numéricas e incluir valores nulos. Agora você pode usar esse conhecimento para encontrar o(s) valor(es) da moda em seus próprios projetos de análise de dados.