Introdução
Este laboratório demonstra como traçar vários conjuntos de dados de classificação gerados aleatoriamente usando a biblioteca scikit-learn do Python. Ele visualiza todos os conjuntos de dados usando duas características, plotadas nos eixos x e y. A cor de cada ponto representa sua etiqueta de classe.
Dicas da Máquina Virtual
Após o arranque da máquina virtual, clique no canto superior esquerdo para mudar para a aba Notebook para aceder ao Jupyter Notebook para praticar.
Por vezes, pode ser necessário esperar alguns segundos para o Jupyter Notebook terminar de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se tiver problemas durante a aprendizagem, não hesite em contactar o Labby. Forneça feedback após a sessão e resolveremos o problema rapidamente para si.
Importar Bibliotecas
Primeiro, precisamos importar as bibliotecas necessárias. Usaremos matplotlib e scikit-learn.
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.datasets import make_blobs
from sklearn.datasets import make_gaussian_quantiles
Definir o Tamanho da Figura e Ajustar os Subgráficos
Definimos o tamanho da figura e ajustamos os subgráficos para torná-los mais legíveis.
plt.figure(figsize=(8, 8))
plt.subplots_adjust(bottom=0.05, top=0.9, left=0.05, right=0.95)
Um Recurso Informativo, um Cluster por Classe
Criamos um conjunto de dados com um recurso informativo e um cluster por classe, e o plotamos.
plt.subplot(321)
plt.title("Um recurso informativo, um cluster por classe", fontsize="small")
X1, Y1 = make_classification(n_features=2, n_redundant=0, n_informative=1, n_clusters_per_class=1)
plt.scatter(X1[:, 0], X1[:, 1], marker="o", c=Y1, s=25, edgecolor="k")
Dois Recursos Informativos, um Cluster por Classe
Criamos um conjunto de dados com dois recursos informativos e um cluster por classe, e o plotamos.
plt.subplot(322)
plt.title("Dois recursos informativos, um cluster por classe", fontsize="small")
X1, Y1 = make_classification(n_features=2, n_redundant=0, n_informative=2, n_clusters_per_class=1)
plt.scatter(X1[:, 0], X1[:, 1], marker="o", c=Y1, s=25, edgecolor="k")
Dois Recursos Informativos, Dois Clusters por Classe
Criamos um conjunto de dados com dois recursos informativos e dois clusters por classe, e o plotamos.
plt.subplot(323)
plt.title("Dois recursos informativos, dois clusters por classe", fontsize="small")
X2, Y2 = make_classification(n_features=2, n_redundant=0, n_informative=2)
plt.scatter(X2[:, 0], X2[:, 1], marker="o", c=Y2, s=25, edgecolor="k")
Múltiplas Classes, Dois Recursos Informativos, um Cluster
Criamos um conjunto de dados com múltiplas classes, dois recursos informativos e um cluster, e o plotamos.
plt.subplot(324)
plt.title("Múltiplas classes, dois recursos informativos, um cluster", fontsize="small")
X1, Y1 = make_classification(n_features=2, n_redundant=0, n_informative=2, n_clusters_per_class=1, n_classes=3)
plt.scatter(X1[:, 0], X1[:, 1], marker="o", c=Y1, s=25, edgecolor="k")
Três Blobs
Criamos um conjunto de dados com três blobs e o plotamos.
plt.subplot(325)
plt.title("Três blobs", fontsize="small")
X1, Y1 = make_blobs(n_features=2, centers=3)
plt.scatter(X1[:, 0], X1[:, 1], marker="o", c=Y1, s=25, edgecolor="k")
Gaussiana Dividida em Três Quantis
Criamos um conjunto de dados com uma gaussiana dividida em três quantis e o plotamos.
plt.subplot(326)
plt.title("Gaussiana dividida em três quantis", fontsize="small")
X1, Y1 = make_gaussian_quantiles(n_features=2, n_classes=3)
plt.scatter(X1[:, 0], X1[:, 1], marker="o", c=Y1, s=25, edgecolor="k")
Mostrar Gráfico
Mostramos o gráfico final.
plt.show()
Resumo
Este laboratório demonstrou como plotar vários conjuntos de dados de classificação gerados aleatoriamente usando a biblioteca scikit-learn do Python. Ele visualiza todos os conjuntos de dados usando duas características, plotadas nos eixos x e y. A cor de cada ponto representa sua classe.