Entscheidungsbäume auf dem Iris-Datensatz

Machine LearningMachine LearningBeginner
Jetzt üben

This tutorial is from open-source community. Access the source code

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab verwenden wir den Iris-Datensatz und Entscheidungsbäume, um die Arten von Iris-Blumen zu klassifizieren. Zunächst visualisieren wir die Entscheidungsgrenzen von Entscheidungsbäumen, die auf Paaren von Merkmalen des Iris-Datensatzes trainiert wurden. Anschließend zeigen wir die Struktur eines einzelnen Entscheidungsbaums, der auf allen Merkmalen des Iris-Datensatzes trainiert wurde.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"]) sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"]) sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"]) ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"]) sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/tree("Decision Trees") sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/inspection("Inspection") sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets") ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn") subgraph Lab Skills sklearn/tree -.-> lab-49167{{"Entscheidungsbäume auf dem Iris-Datensatz"}} sklearn/inspection -.-> lab-49167{{"Entscheidungsbäume auf dem Iris-Datensatz"}} sklearn/datasets -.-> lab-49167{{"Entscheidungsbäume auf dem Iris-Datensatz"}} ml/sklearn -.-> lab-49167{{"Entscheidungsbäume auf dem Iris-Datensatz"}} end

Lade den Iris-Datensatz

Der erste Schritt besteht darin, den Iris-Datensatz mit scikit-learn zu laden.

from sklearn.datasets import load_iris

iris = load_iris()

Visualisiere Entscheidungsgrenzen

Wir werden nun die Entscheidungsgrenzen von Entscheidungsbäumen visualisieren, die auf Paaren von Merkmalen des Iris-Datensatzes trainiert wurden.

import numpy as np
import matplotlib.pyplot as plt

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.inspection import DecisionBoundaryDisplay

## Parameter
n_classes = 3
plot_colors = "ryb"
plot_step = 0.02

for pairidx, pair in enumerate([[0, 1], [0, 2], [0, 3], [1, 2], [1, 3], [2, 3]]):
    ## Wir nehmen nur die beiden entsprechenden Merkmale
    X = iris.data[:, pair]
    y = iris.target

    ## Trainiere
    clf = DecisionTreeClassifier().fit(X, y)

    ## Zeichne die Entscheidungsgrenze
    ax = plt.subplot(2, 3, pairidx + 1)
    plt.tight_layout(h_pad=0.5, w_pad=0.5, pad=2.5)
    DecisionBoundaryDisplay.from_estimator(
        clf,
        X,
        cmap=plt.cm.RdYlBu,
        response_method="predict",
        ax=ax,
        xlabel=iris.feature_names[pair[0]],
        ylabel=iris.feature_names[pair[1]],
    )

    ## Zeichne die Trainingspunkte
    for i, color in zip(range(n_classes), plot_colors):
        idx = np.where(y == i)
        plt.scatter(
            X[idx, 0],
            X[idx, 1],
            c=color,
            label=iris.target_names[i],
            cmap=plt.cm.RdYlBu,
            edgecolor="black",
            s=15,
        )

plt.suptitle("Entscheidungsfläche von Entscheidungsbäumen, die auf Paaren von Merkmalen trainiert wurden")
plt.legend(loc="lower right", borderpad=0, handletextpad=0)
_ = plt.axis("tight")

Zeige die Struktur des Entscheidungsbaums

Als nächstes werden wir die Struktur eines einzelnen Entscheidungsbaums anzeigen, der auf allen Merkmalen des Iris-Datensatzes trainiert wurde.

from sklearn.tree import plot_tree

plt.figure()
clf = DecisionTreeClassifier().fit(iris.data, iris.target)
plot_tree(clf, filled=True)
plt.title("Entscheidungsbaum, der auf allen Iris-Merkmalen trainiert wurde")
plt.show()

Zusammenfassung

In diesem Lab haben wir Entscheidungsbäume verwendet, um die Arten von Iris-Blumen zu klassifizieren. Zunächst haben wir die Entscheidungsgrenzen von Entscheidungsbäumen visualisiert, die auf Paaren von Merkmalen des Iris-Datensatzes trainiert wurden. Anschließend haben wir die Struktur eines einzelnen Entscheidungsbaums angezeigt, der auf allen Merkmalen des Iris-Datensatzes trainiert wurde.