Introdução
Pandas é uma ferramenta poderosa de manipulação de dados desenvolvida em Python. É frequentemente utilizada em análise e limpeza de dados por ser flexível e fácil de usar. Neste laboratório, aprenderemos como usar Pandas para realizar operações básicas, como carregar dados, criar data frames (quadros de dados), acessar dados e realizar estatísticas simples.
Dicas para a VM (Máquina Virtual)
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importando o Pacote Pandas
Antes de usar Pandas, você precisa importá-lo. É uma prática comum importar Pandas com o alias pd.
## Importing pandas package
import pandas as pd
Criando um DataFrame (Quadro de Dados)
Os dados em pandas são armazenados em um DataFrame, que é uma estrutura de dados rotulada bidimensional com colunas potencialmente de diferentes tipos.
## Creating a DataFrame
df = pd.DataFrame(
{
"Name": [
"Braund, Mr. Owen Harris",
"Allen, Mr. William Henry",
"Bonnell, Miss. Elizabeth",
],
"Age": [22, 35, 58],
"Sex": ["male", "male", "female"],
}
)
Selecionando uma Coluna
Se você deseja trabalhar com dados em uma coluna específica, pode selecioná-la usando o rótulo da coluna. O resultado é uma pandas Series (Série).
## Selecting the 'Age' column
df["Age"]
Realizando Estatísticas Básicas
Pandas oferece muitas funcionalidades para realizar estatísticas. Por exemplo, você pode encontrar o valor máximo em uma coluna usando max().
## Finding the maximum age
df["Age"].max()
Você também pode obter uma visão geral rápida dos dados numéricos em um DataFrame usando describe().
## Describing the numerical data
df.describe()
Resumo
Neste laboratório, aprendemos como importar o pacote Pandas, criar um DataFrame, selecionar uma coluna e realizar estatísticas básicas. Pandas é uma ferramenta versátil que pode lidar com dados de diferentes tipos, tornando-a uma ótima escolha para análise e manipulação de dados.