Visualizando Relações entre Variáveis

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Neste laboratório, aprenderemos como criar um gráfico de dispersão simples usando a biblioteca Matplotlib do Python. Um gráfico de dispersão (scatter plot) é um tipo de gráfico que exibe valores para duas variáveis como uma coleção de pontos. Cada ponto representa os valores das duas variáveis, e a posição do ponto representa os valores das duas variáveis. Gráficos de dispersão são úteis para identificar relações entre variáveis e para identificar outliers (valores discrepantes).

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Nesta etapa, importaremos as bibliotecas necessárias para criar um gráfico de dispersão. Usaremos a biblioteca Matplotlib para criar o gráfico e a biblioteca NumPy para gerar dados aleatórios.

import matplotlib.pyplot as plt
import numpy as np

Gerar dados aleatórios

Nesta etapa, geraremos dados aleatórios para nosso gráfico de dispersão. Geraremos 50 pontos de dados para cada variável usando a biblioteca NumPy.

np.random.seed(19680801)

N = 50
x = np.random.rand(N)
y = np.random.rand(N)

Definir o tamanho e a cor dos pontos

Nesta etapa, definiremos o tamanho e a cor dos pontos em nosso gráfico de dispersão. Usaremos a biblioteca NumPy para gerar valores aleatórios para o tamanho e a cor dos pontos.

colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2

Criar o gráfico de dispersão

Nesta etapa, criaremos o gráfico de dispersão usando a biblioteca Matplotlib. Usaremos a função scatter para criar o gráfico e especificar o tamanho e a cor dos pontos.

plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()

Resumo

Neste laboratório, aprendemos como criar um gráfico de dispersão simples usando a biblioteca Matplotlib do Python. Geramos dados aleatórios para o gráfico usando a biblioteca NumPy, definimos o tamanho e a cor dos pontos e criamos o gráfico usando a função scatter da biblioteca Matplotlib. Gráficos de dispersão são úteis para identificar relações entre variáveis e para identificar outliers (valores discrepantes).