Plotando Dados Categóricos com Matplotlib

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Matplotlib é uma popular biblioteca de visualização de dados em Python. Ela oferece uma variedade de gráficos e plots personalizáveis para exploração e apresentação de dados. Neste laboratório, aprenderemos como plotar variáveis categóricas usando Matplotlib.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importando Matplotlib

O primeiro passo é importar a biblioteca Matplotlib. Também usaremos a biblioteca numpy para gerar alguns dados de exemplo.

import matplotlib.pyplot as plt
import numpy as np

Preparando os Dados

Em seguida, prepararemos alguns dados de exemplo para plotar. Criaremos um dicionário com as contagens de diferentes frutas e, em seguida, extrairemos as chaves e os valores em listas separadas.

data = {'apple': 10, 'orange': 15, 'lemon': 5, 'lime': 20}
names = list(data.keys())
values = list(data.values())

Gráfico de Barras (Bar Plot)

Um gráfico de barras (bar plot) é uma boa maneira de exibir dados categóricos. Podemos criar um gráfico de barras usando a função bar.

plt.bar(names, values)
plt.title('Fruit Counts')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()

Gráfico de Dispersão (Scatter Plot)

Também podemos criar um gráfico de dispersão (scatter plot) para mostrar a relação entre duas variáveis categóricas. Neste caso, usaremos os mesmos dados de frutas e adicionaremos algum ruído aleatório às contagens para criar uma segunda variável.

noise = np.random.rand(len(values)) * 5
plt.scatter(names, values + noise)
plt.title('Fruit Counts with Noise')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()

Gráfico de Linhas (Line Plot)

Um gráfico de linhas (line plot) pode ser usado para mostrar como uma variável categórica muda ao longo do tempo. Neste exemplo, usaremos dados sobre os níveis de felicidade de gatos e cães durante diferentes atividades.

cat = ["bored", "happy", "bored", "bored", "happy", "bored"]
dog = ["happy", "happy", "happy", "happy", "bored", "bored"]
activity = ["combing", "drinking", "feeding", "napping", "playing", "washing"]
plt.plot(activity, dog, label="dog")
plt.plot(activity, cat, label="cat")
plt.title('Happiness Levels')
plt.xlabel('Activity')
plt.ylabel('Happiness')
plt.legend()
plt.show()

Resumo

Neste laboratório, aprendemos como plotar variáveis categóricas usando Matplotlib. Criamos gráficos de barras (bar plots), gráficos de dispersão (scatter plots) e gráficos de linhas (line plots) para visualizar diferentes tipos de dados categóricos. Ao personalizar os rótulos dos eixos, títulos e legendas, podemos criar gráficos informativos e visualmente atraentes para comunicar nossos dados de forma eficaz.