Introdução
Este laboratório foca-se em entender como configurar e personalizar o comportamento global relacionado à exibição de DataFrames do Pandas, comportamento de dados e muito mais. Exploraremos como obter/definir opções, redefinir opções para seus valores padrão e descrever opções. Também aprenderemos como executar um bloco de código com um conjunto de opções que revertem para as configurações anteriores após a execução.
Dicas da VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook para acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importando Pandas
Vamos começar importando a biblioteca Pandas. Esta é uma poderosa biblioteca de manipulação de dados em Python.
## Importando a biblioteca pandas
import pandas as pd
Obtendo e Definindo Opções
Podemos obter ou definir o valor de uma única opção usando pd.get_option ou pd.set_option, respectivamente. Aqui, estamos definindo o número máximo de linhas a serem exibidas para 999.
## Obter a configuração atual para o número máximo de linhas a serem exibidas
print(pd.options.display.max_rows)
## Definir o número máximo de linhas a serem exibidas para 999
pd.options.display.max_rows = 999
## Verificar a nova configuração
print(pd.options.display.max_rows)
Resetando Opções
Se desejamos redefinir uma ou mais opções para seus valores padrão, podemos usar pd.reset_option.
## Redefinir o número máximo de linhas a serem exibidas para o padrão
pd.reset_option("display.max_rows")
## Verificar a redefinição
print(pd.options.display.max_rows)
Descrevendo Opções
Para imprimir as descrições de uma ou mais opções, use pd.describe_option.
## Descrever a opção 'display.max_rows'
pd.describe_option("display.max_rows")
Usando option_context
A função option_context nos permite executar um bloco de código com um conjunto de opções que revertem para as configurações anteriores após a execução.
## Executar um bloco de código com um conjunto de opções
with pd.option_context("display.max_rows", 10):
## Isso imprimirá 10, apesar da configuração global ser diferente
print(pd.get_option("display.max_rows"))
## Isso imprimirá a configuração global, pois o bloco de contexto terminou
print(pd.get_option("display.max_rows"))
Definindo Opções de Inicialização
Podemos criar um script de inicialização no ambiente Python/IPython para importar pandas e definir opções, o que torna o trabalho com pandas mais eficiente.
## Este é um exemplo de um script de inicialização
## Coloque isso em um arquivo .py no diretório de inicialização do perfil IPython
import pandas as pd
pd.set_option("display.max_rows", 999)
pd.set_option("display.precision", 5)
Resumo
Este guia de laboratório explicou como obter, definir e redefinir opções no pandas. Também discutimos como descrever opções e usar a função option_context. Finalmente, exploramos como definir opções de inicialização no ambiente Python/IPython. Essas técnicas nos permitem personalizar e configurar o comportamento do pandas para atender às nossas necessidades.