Método Mediana em DataFrame Pandas

Beginner

Introdução

Neste laboratório, aprenderemos como usar o método median() na biblioteca Pandas para calcular a mediana dos valores em um DataFrame. O método median() nos permite encontrar o valor do meio em um conjunto de dados, fornecendo uma medida de tendência central.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar a biblioteca pandas

Primeiramente, precisamos importar a biblioteca 'pandas', que é comumente usada para manipulação e análise de dados.

import pandas as pd

Criar um DataFrame

Em seguida, criaremos um objeto DataFrame usando o construtor pd.DataFrame(). Isso nos permitirá armazenar e manipular nossos dados.

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print("------O DataFrame é------")
print(df)

Calcular a mediana ao longo do eixo do índice

Para calcular a mediana ao longo do eixo do índice do DataFrame, podemos usar o método median() com o parâmetro axis definido como 0.

print("---------------------------")
print(df.median(axis=0))

Calcular a mediana ao longo do eixo da coluna

Para calcular a mediana ao longo do eixo da coluna do DataFrame, podemos usar o método median() com o parâmetro axis definido como 1.

print("---------------------------")
print(df.median(axis=1))

Tratamento de valores nulos

Se nosso DataFrame contiver valores nulos, podemos tratá-los especificando o parâmetro skipna. Por padrão, skipna é definido como True, o que exclui valores nulos ao calcular a mediana. Se quisermos incluir valores nulos, podemos definir skipna como False.

df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
print("------O DataFrame é------")
print(df)
print("---------------------------")
print(df.median(axis=0, skipna=False))

Resumo

Neste laboratório, aprendemos como usar o método median() no Pandas para calcular a mediana dos valores em um DataFrame. Exploramos como calcular a mediana ao longo do eixo do índice e do eixo da coluna. Além disso, aprendemos como lidar com valores nulos ao calcular a mediana. Calcular a mediana é útil para entender a tendência central de um conjunto de dados e pode ser usado para tomar decisões informadas na análise de dados.