Trabalhando com Pandas

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Pandas é uma ferramenta poderosa de manipulação de dados desenvolvida em Python. É frequentemente utilizada em análise e limpeza de dados por ser flexível e fácil de usar. Neste laboratório, aprenderemos como usar Pandas para realizar operações básicas, como carregar dados, criar data frames (quadros de dados), acessar dados e realizar estatísticas simples.

Dicas para a VM (Máquina Virtual)

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Este é um Lab Guiado, que fornece instruções passo a passo para ajudá-lo a aprender e praticar. Siga as instruções cuidadosamente para completar cada etapa e ganhar experiência prática. Dados históricos mostram que este é um laboratório de nível iniciante com uma taxa de conclusão de 86%. Recebeu uma taxa de avaliações positivas de 100% dos estudantes.

Importando o Pacote Pandas

Antes de usar Pandas, você precisa importá-lo. É uma prática comum importar Pandas com o alias pd.

## Importing pandas package
import pandas as pd

Criando um DataFrame (Quadro de Dados)

Os dados em pandas são armazenados em um DataFrame, que é uma estrutura de dados rotulada bidimensional com colunas potencialmente de diferentes tipos.

## Creating a DataFrame
df = pd.DataFrame(
    {
        "Name": [
            "Braund, Mr. Owen Harris",
            "Allen, Mr. William Henry",
            "Bonnell, Miss. Elizabeth",
        ],
        "Age": [22, 35, 58],
        "Sex": ["male", "male", "female"],
    }
)

Selecionando uma Coluna

Se você deseja trabalhar com dados em uma coluna específica, pode selecioná-la usando o rótulo da coluna. O resultado é uma pandas Series (Série).

## Selecting the 'Age' column
df["Age"]

Realizando Estatísticas Básicas

Pandas oferece muitas funcionalidades para realizar estatísticas. Por exemplo, você pode encontrar o valor máximo em uma coluna usando max().

## Finding the maximum age
df["Age"].max()

Você também pode obter uma visão geral rápida dos dados numéricos em um DataFrame usando describe().

## Describing the numerical data
df.describe()

Resumo

Neste laboratório, aprendemos como importar o pacote Pandas, criar um DataFrame, selecionar uma coluna e realizar estatísticas básicas. Pandas é uma ferramenta versátil que pode lidar com dados de diferentes tipos, tornando-a uma ótima escolha para análise e manipulação de dados.