Introdução
Neste laboratório, aprenderemos como usar o método median() na biblioteca Pandas para calcular a mediana dos valores em um DataFrame. O método median() nos permite encontrar o valor do meio em um conjunto de dados, fornecendo uma medida de tendência central.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar a biblioteca pandas
Primeiramente, precisamos importar a biblioteca 'pandas', que é comumente usada para manipulação e análise de dados.
import pandas as pd
Criar um DataFrame
Em seguida, criaremos um objeto DataFrame usando o construtor pd.DataFrame(). Isso nos permitirá armazenar e manipular nossos dados.
df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print("------O DataFrame é------")
print(df)
Calcular a mediana ao longo do eixo do índice
Para calcular a mediana ao longo do eixo do índice do DataFrame, podemos usar o método median() com o parâmetro axis definido como 0.
print("---------------------------")
print(df.median(axis=0))
Calcular a mediana ao longo do eixo da coluna
Para calcular a mediana ao longo do eixo da coluna do DataFrame, podemos usar o método median() com o parâmetro axis definido como 1.
print("---------------------------")
print(df.median(axis=1))
Tratamento de valores nulos
Se nosso DataFrame contiver valores nulos, podemos tratá-los especificando o parâmetro skipna. Por padrão, skipna é definido como True, o que exclui valores nulos ao calcular a mediana. Se quisermos incluir valores nulos, podemos definir skipna como False.
df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
print("------O DataFrame é------")
print(df)
print("---------------------------")
print(df.median(axis=0, skipna=False))
Resumo
Neste laboratório, aprendemos como usar o método median() no Pandas para calcular a mediana dos valores em um DataFrame. Exploramos como calcular a mediana ao longo do eixo do índice e do eixo da coluna. Além disso, aprendemos como lidar com valores nulos ao calcular a mediana. Calcular a mediana é útil para entender a tendência central de um conjunto de dados e pode ser usado para tomar decisões informadas na análise de dados.