Introdução
Neste laboratório, aprenderemos como trabalhar com colunas no Pandas. Exploraremos como criar novas colunas derivadas das existentes, aplicar operações matemáticas e lógicas em colunas, renomear rótulos de colunas e realizar operações por coluna usando o método apply.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar Pandas e Carregar Dados
Primeiramente, importaremos a biblioteca pandas e carregaremos os dados de qualidade do ar de um arquivo CSV.
## Importar a biblioteca pandas
import pandas as pd
## Carregar dados de qualidade do ar
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
Criar uma Nova Coluna
Criaremos uma nova coluna, "london_mg_per_cubic", multiplicando a coluna "station_london" por um fator de conversão.
## Criar nova coluna multiplicando "station_london" por fator de conversão
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882
Verificar a Razão dos Valores em Duas Colunas
Em seguida, verificaremos a razão dos valores nas colunas "station_paris" e "station_antwerp" e salvaremos o resultado em uma nova coluna.
## Criar nova coluna dividindo "station_paris" por "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]
Renomear os Rótulos das Colunas
Renomearemos os rótulos das colunas para corresponder aos identificadores das estações usados pelo OpenAQ.
## Renomear os rótulos das colunas
air_quality_renamed = air_quality.rename(
columns={
"station_antwerp": "BETR801",
"station_paris": "FR04014",
"station_london": "London Westminster",
}
)
Converter os Rótulos das Colunas para Minúsculas
Finalmente, converteremos os rótulos das colunas para minúsculas usando uma função.
## Converter os rótulos das colunas para minúsculas
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)
Resumo
Neste laboratório, aprendemos como criar novas colunas derivadas de colunas existentes, realizar operações matemáticas e lógicas em colunas, renomear rótulos de colunas e converter rótulos de colunas para minúsculas. Com estas habilidades, podemos manipular e transformar dados no pandas de forma mais eficaz.