Opções e Configurações do Pandas

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Este laboratório foca-se em entender como configurar e personalizar o comportamento global relacionado à exibição de DataFrames do Pandas, comportamento de dados e muito mais. Exploraremos como obter/definir opções, redefinir opções para seus valores padrão e descrever opções. Também aprenderemos como executar um bloco de código com um conjunto de opções que revertem para as configurações anteriores após a execução.

Dicas da VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook para acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importando Pandas

Vamos começar importando a biblioteca Pandas. Esta é uma poderosa biblioteca de manipulação de dados em Python.

## Importando a biblioteca pandas
import pandas as pd

Obtendo e Definindo Opções

Podemos obter ou definir o valor de uma única opção usando pd.get_option ou pd.set_option, respectivamente. Aqui, estamos definindo o número máximo de linhas a serem exibidas para 999.

## Obter a configuração atual para o número máximo de linhas a serem exibidas
print(pd.options.display.max_rows)

## Definir o número máximo de linhas a serem exibidas para 999
pd.options.display.max_rows = 999

## Verificar a nova configuração
print(pd.options.display.max_rows)

Resetando Opções

Se desejamos redefinir uma ou mais opções para seus valores padrão, podemos usar pd.reset_option.

## Redefinir o número máximo de linhas a serem exibidas para o padrão
pd.reset_option("display.max_rows")

## Verificar a redefinição
print(pd.options.display.max_rows)

Descrevendo Opções

Para imprimir as descrições de uma ou mais opções, use pd.describe_option.

## Descrever a opção 'display.max_rows'
pd.describe_option("display.max_rows")

Usando option_context

A função option_context nos permite executar um bloco de código com um conjunto de opções que revertem para as configurações anteriores após a execução.

## Executar um bloco de código com um conjunto de opções
with pd.option_context("display.max_rows", 10):
    ## Isso imprimirá 10, apesar da configuração global ser diferente
    print(pd.get_option("display.max_rows"))

## Isso imprimirá a configuração global, pois o bloco de contexto terminou
print(pd.get_option("display.max_rows"))

Definindo Opções de Inicialização

Podemos criar um script de inicialização no ambiente Python/IPython para importar pandas e definir opções, o que torna o trabalho com pandas mais eficiente.

## Este é um exemplo de um script de inicialização
## Coloque isso em um arquivo .py no diretório de inicialização do perfil IPython
import pandas as pd

pd.set_option("display.max_rows", 999)
pd.set_option("display.precision", 5)

Resumo

Este guia de laboratório explicou como obter, definir e redefinir opções no pandas. Também discutimos como descrever opções e usar a função option_context. Finalmente, exploramos como definir opções de inicialização no ambiente Python/IPython. Essas técnicas nos permitem personalizar e configurar o comportamento do pandas para atender às nossas necessidades.