Fundamentos da Manipulação de Dados com Pandas

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Este Lab de Python Pandas tem como objetivo apresentar as operações fundamentais da biblioteca pandas, uma poderosa ferramenta de manipulação de dados em Python. Ao longo deste laboratório, você trabalhará com inúmeros exemplos e trechos de código para solidificar sua compreensão do pandas.

Dicas para a VM (Máquina Virtual)

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importando Pandas

Primeiramente, precisamos importar a biblioteca pandas. Isso pode ser feito com o seguinte comando:

## Importando a biblioteca pandas
import pandas as pd
import numpy as np

Criando um DataFrame

Em seguida, criaremos um DataFrame, que é uma estrutura de dados rotulada bidimensional com colunas de tipos potencialmente diferentes. É geralmente o objeto pandas mais comumente usado.

## Criando um DataFrame com um dicionário
df = pd.DataFrame({'A': [1, 2, 3]})

Entendendo DataFrames

Agora, vamos tentar entender mais sobre o DataFrame que acabamos de criar.

## Exibindo o DataFrame
print(df)

## Informações sobre o DataFrame
df.info()

Trabalhando com Dados Ausentes

Pandas fornece vários métodos para limpar dados e preencher valores ausentes.

## Criando um DataFrame com valores ausentes
df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [5, np.nan, np.nan], 'C': [1, 2, 3]})

## Preenchendo valores ausentes
df.fillna(value=0, inplace=True)

Visualização de Dados

Pandas fornece visualização de dados, permitindo a integração com a biblioteca Matplotlib.

## Importando a biblioteca matplotlib
import matplotlib.pyplot as plt

## Plotando um gráfico
df['A'].plot()
plt.show()

Resumo

Neste laboratório, cobrimos alguns dos fundamentos da biblioteca pandas em Python, incluindo a importação da biblioteca, a criação e manipulação de um DataFrame, o tratamento de dados ausentes e a visualização dos dados. Essas habilidades são fundamentais para qualquer tarefa de análise de dados em Python, e tornar-se proficiente em pandas permitirá que você lide e analise dados de forma eficaz.