Introdução
Neste laboratório, aprenderemos como criar um gráfico de dispersão simples usando a biblioteca Matplotlib do Python. Um gráfico de dispersão (scatter plot) é um tipo de gráfico que exibe valores para duas variáveis como uma coleção de pontos. Cada ponto representa os valores das duas variáveis, e a posição do ponto representa os valores das duas variáveis. Gráficos de dispersão são úteis para identificar relações entre variáveis e para identificar outliers (valores discrepantes).
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias
Nesta etapa, importaremos as bibliotecas necessárias para criar um gráfico de dispersão. Usaremos a biblioteca Matplotlib para criar o gráfico e a biblioteca NumPy para gerar dados aleatórios.
import matplotlib.pyplot as plt
import numpy as np
Gerar dados aleatórios
Nesta etapa, geraremos dados aleatórios para nosso gráfico de dispersão. Geraremos 50 pontos de dados para cada variável usando a biblioteca NumPy.
np.random.seed(19680801)
N = 50
x = np.random.rand(N)
y = np.random.rand(N)
Definir o tamanho e a cor dos pontos
Nesta etapa, definiremos o tamanho e a cor dos pontos em nosso gráfico de dispersão. Usaremos a biblioteca NumPy para gerar valores aleatórios para o tamanho e a cor dos pontos.
colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2
Criar o gráfico de dispersão
Nesta etapa, criaremos o gráfico de dispersão usando a biblioteca Matplotlib. Usaremos a função scatter para criar o gráfico e especificar o tamanho e a cor dos pontos.
plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()
Resumo
Neste laboratório, aprendemos como criar um gráfico de dispersão simples usando a biblioteca Matplotlib do Python. Geramos dados aleatórios para o gráfico usando a biblioteca NumPy, definimos o tamanho e a cor dos pontos e criamos o gráfico usando a função scatter da biblioteca Matplotlib. Gráficos de dispersão são úteis para identificar relações entre variáveis e para identificar outliers (valores discrepantes).