Método Cummax em DataFrame Pandas

Beginner

Introdução

Neste laboratório, aprenderemos como usar o método cummax() na biblioteca pandas. O método cummax() é usado para calcular o máximo cumulativo sobre um eixo de um DataFrame ou Series. Ele retorna um DataFrame ou Series do mesmo tamanho, contendo os valores máximos cumulativos.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar a biblioteca pandas

Para usar o método cummax(), primeiro precisamos importar a biblioteca pandas. Podemos fazer isso executando o seguinte código:

import pandas as pd

Criar um DataFrame

Em seguida, precisamos criar um DataFrame no qual podemos aplicar o método cummax(). Podemos criar um DataFrame usando a função pd.DataFrame() e passando um dicionário. Cada chave no dicionário representa um nome de coluna, e o valor correspondente é uma lista contendo os dados da coluna.

df = pd.DataFrame({"A":[1, 2, 8, 4], "B":[9, 10, 7, 8], "C":[9, 10, 11, 12], "D":[13, 16, 15, 16]})

Aplicar o método cummax()

Agora, podemos aplicar o método cummax() ao nosso DataFrame. O método cummax() aceita três parâmetros opcionais: axis, skipna e argumentos/palavras-chave (args/kwargs) adicionais.

O parâmetro axis é usado para especificar o eixo ao longo do qual o máximo cumulativo deve ser calculado. Por padrão, ele é definido como 0 ou 'index', o que significa que o máximo cumulativo será calculado sobre o eixo do índice. Se definido como 1 ou 'columns', o máximo cumulativo será calculado sobre o eixo das colunas.

O parâmetro skipna é um booleano que determina se valores NA/nulos devem ser excluídos do cálculo. Se definido como True, valores NA/nulos serão excluídos. Se definido como False, valores NA/nulos serão incluídos.

Para aplicar o método cummax(), podemos usar o seguinte código:

df_cummax = df.cummax(axis=0, skipna=True)

Imprimir o resultado

Finalmente, podemos imprimir o resultado do método cummax() para ver os valores máximos cumulativos.

print(df_cummax)

Resumo

Neste laboratório, aprendemos como usar o método cummax() na biblioteca pandas para calcular o máximo cumulativo sobre um eixo de DataFrame ou Series. Vimos como importar a biblioteca pandas, criar um DataFrame, aplicar o método cummax() com parâmetros opcionais e imprimir o resultado. O método cummax() é útil para analisar tendências e encontrar os valores mais altos em um conjunto de dados ao longo do tempo. Ele pode ser uma ferramenta valiosa em processos de análise de dados e tomada de decisões.