Plotagem de Conjuntos de Dados de Classificação Aleatórios

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Este laboratório demonstra como traçar vários conjuntos de dados de classificação gerados aleatoriamente usando a biblioteca scikit-learn do Python. Ele visualiza todos os conjuntos de dados usando duas características, plotadas nos eixos x e y. A cor de cada ponto representa sua etiqueta de classe.

Dicas da Máquina Virtual

Após o arranque da máquina virtual, clique no canto superior esquerdo para mudar para a aba Notebook para aceder ao Jupyter Notebook para praticar.

Por vezes, pode ser necessário esperar alguns segundos para o Jupyter Notebook terminar de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se tiver problemas durante a aprendizagem, não hesite em contactar o Labby. Forneça feedback após a sessão e resolveremos o problema rapidamente para si.

Importar Bibliotecas

Primeiro, precisamos importar as bibliotecas necessárias. Usaremos matplotlib e scikit-learn.

import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.datasets import make_blobs
from sklearn.datasets import make_gaussian_quantiles

Definir o Tamanho da Figura e Ajustar os Subgráficos

Definimos o tamanho da figura e ajustamos os subgráficos para torná-los mais legíveis.

plt.figure(figsize=(8, 8))
plt.subplots_adjust(bottom=0.05, top=0.9, left=0.05, right=0.95)

Um Recurso Informativo, um Cluster por Classe

Criamos um conjunto de dados com um recurso informativo e um cluster por classe, e o plotamos.

plt.subplot(321)
plt.title("Um recurso informativo, um cluster por classe", fontsize="small")
X1, Y1 = make_classification(n_features=2, n_redundant=0, n_informative=1, n_clusters_per_class=1)
plt.scatter(X1[:, 0], X1[:, 1], marker="o", c=Y1, s=25, edgecolor="k")

Dois Recursos Informativos, um Cluster por Classe

Criamos um conjunto de dados com dois recursos informativos e um cluster por classe, e o plotamos.

plt.subplot(322)
plt.title("Dois recursos informativos, um cluster por classe", fontsize="small")
X1, Y1 = make_classification(n_features=2, n_redundant=0, n_informative=2, n_clusters_per_class=1)
plt.scatter(X1[:, 0], X1[:, 1], marker="o", c=Y1, s=25, edgecolor="k")

Dois Recursos Informativos, Dois Clusters por Classe

Criamos um conjunto de dados com dois recursos informativos e dois clusters por classe, e o plotamos.

plt.subplot(323)
plt.title("Dois recursos informativos, dois clusters por classe", fontsize="small")
X2, Y2 = make_classification(n_features=2, n_redundant=0, n_informative=2)
plt.scatter(X2[:, 0], X2[:, 1], marker="o", c=Y2, s=25, edgecolor="k")

Múltiplas Classes, Dois Recursos Informativos, um Cluster

Criamos um conjunto de dados com múltiplas classes, dois recursos informativos e um cluster, e o plotamos.

plt.subplot(324)
plt.title("Múltiplas classes, dois recursos informativos, um cluster", fontsize="small")
X1, Y1 = make_classification(n_features=2, n_redundant=0, n_informative=2, n_clusters_per_class=1, n_classes=3)
plt.scatter(X1[:, 0], X1[:, 1], marker="o", c=Y1, s=25, edgecolor="k")

Três Blobs

Criamos um conjunto de dados com três blobs e o plotamos.

plt.subplot(325)
plt.title("Três blobs", fontsize="small")
X1, Y1 = make_blobs(n_features=2, centers=3)
plt.scatter(X1[:, 0], X1[:, 1], marker="o", c=Y1, s=25, edgecolor="k")

Gaussiana Dividida em Três Quantis

Criamos um conjunto de dados com uma gaussiana dividida em três quantis e o plotamos.

plt.subplot(326)
plt.title("Gaussiana dividida em três quantis", fontsize="small")
X1, Y1 = make_gaussian_quantiles(n_features=2, n_classes=3)
plt.scatter(X1[:, 0], X1[:, 1], marker="o", c=Y1, s=25, edgecolor="k")

Mostrar Gráfico

Mostramos o gráfico final.

plt.show()

Resumo

Este laboratório demonstrou como plotar vários conjuntos de dados de classificação gerados aleatoriamente usando a biblioteca scikit-learn do Python. Ele visualiza todos os conjuntos de dados usando duas características, plotadas nos eixos x e y. A cor de cada ponto representa sua classe.