Criação de Gráfico de Dispersão (Scatter Plot) com Python Matplotlib

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Este laboratório passo a passo irá guiá-lo através do uso da biblioteca Matplotlib do Python para criar visualizações. Matplotlib é uma biblioteca de visualização de dados que permite aos usuários criar uma ampla gama de visualizações, incluindo gráficos de linhas, gráficos de dispersão (scatter plots) e histogramas. Neste laboratório, criaremos um gráfico de dispersão simples usando Matplotlib.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar bibliotecas

Antes de começarmos a criar nossa visualização, precisamos importar as bibliotecas necessárias. Neste exemplo, usaremos numpy e matplotlib.pyplot.

import matplotlib.pyplot as plt
import numpy as np

Criar dados

Em seguida, criaremos alguns dados aleatórios para usar em nossa visualização. Neste exemplo, criaremos dois arrays de dados aleatórios usando numpy.

## Fixing random state for reproducibility
np.random.seed(19680801)

x = np.random.rand(20)
y = 1e7 * np.random.rand(20)

Criar o gráfico

Agora que temos nossos dados, podemos criar nosso gráfico usando Matplotlib. Neste exemplo, criaremos um gráfico de dispersão (scatter plot) usando a função plot().

fig, ax = plt.subplots()
plt.plot(x, y, 'o')

Formatar o gráfico

Para tornar nosso gráfico mais legível, podemos formatá-lo usando as funções de formatação do Matplotlib. Neste exemplo, formataremos os rótulos do eixo y para exibir valores em milhões.

def millions(x):
    return '$%1.1fM' % (x * 1e-6)

ax.fmt_ydata = millions

Exibir o gráfico

Finalmente, podemos exibir nosso gráfico usando a função show() do Matplotlib.

plt.show()

Resumo

Neste laboratório, aprendemos como usar o Matplotlib para criar um gráfico de dispersão (scatter plot). Também aprendemos como formatar o gráfico e exibi-lo. Matplotlib é uma biblioteca poderosa que pode ser usada para criar uma ampla gama de visualizações.