Trabalhando com Colunas no Pandas

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Neste laboratório, aprenderemos como trabalhar com colunas no Pandas. Exploraremos como criar novas colunas derivadas das existentes, aplicar operações matemáticas e lógicas em colunas, renomear rótulos de colunas e realizar operações por coluna usando o método apply.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Este é um Lab Guiado, que fornece instruções passo a passo para ajudá-lo a aprender e praticar. Siga as instruções cuidadosamente para completar cada etapa e ganhar experiência prática. Dados históricos mostram que este é um laboratório de nível iniciante com uma taxa de conclusão de 98%. Recebeu uma taxa de avaliações positivas de 100% dos estudantes.

Importar Pandas e Carregar Dados

Primeiramente, importaremos a biblioteca pandas e carregaremos os dados de qualidade do ar de um arquivo CSV.

## Importar a biblioteca pandas
import pandas as pd

## Carregar dados de qualidade do ar
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)

Criar uma Nova Coluna

Criaremos uma nova coluna, "london_mg_per_cubic", multiplicando a coluna "station_london" por um fator de conversão.

## Criar nova coluna multiplicando "station_london" por fator de conversão
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882

Verificar a Razão dos Valores em Duas Colunas

Em seguida, verificaremos a razão dos valores nas colunas "station_paris" e "station_antwerp" e salvaremos o resultado em uma nova coluna.

## Criar nova coluna dividindo "station_paris" por "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]

Renomear os Rótulos das Colunas

Renomearemos os rótulos das colunas para corresponder aos identificadores das estações usados pelo OpenAQ.

## Renomear os rótulos das colunas
air_quality_renamed = air_quality.rename(
    columns={
        "station_antwerp": "BETR801",
        "station_paris": "FR04014",
        "station_london": "London Westminster",
    }
)

Converter os Rótulos das Colunas para Minúsculas

Finalmente, converteremos os rótulos das colunas para minúsculas usando uma função.

## Converter os rótulos das colunas para minúsculas
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)

Resumo

Neste laboratório, aprendemos como criar novas colunas derivadas de colunas existentes, realizar operações matemáticas e lógicas em colunas, renomear rótulos de colunas e converter rótulos de colunas para minúsculas. Com estas habilidades, podemos manipular e transformar dados no pandas de forma mais eficaz.