Paarweise Maße und Kerne in Scikit-Learn

Machine LearningMachine LearningBeginner
Jetzt üben

This tutorial is from open-source community. Access the source code

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir das Untermodul sklearn.metrics.pairwise in scikit-learn erkunden. Dieses Modul bietet Hilfsmittel zur Berechnung von paarweisen Distanzen und Affinitäten zwischen Mengen von Proben.

Wir werden verschiedene paarweise Metriken und Kerne kennenlernen, ihre Definitionen und wie wir sie in scikit-learn verwenden.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"]) ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"]) sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/metrics("Metrics") ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn") subgraph Lab Skills sklearn/metrics -.-> lab-71135{{"Paarweise Maße und Kerne in Scikit-Learn"}} ml/sklearn -.-> lab-71135{{"Paarweise Maße und Kerne in Scikit-Learn"}} end

Distanzmaße

Distanzmaße sind Funktionen, die die Unähnlichkeit zwischen zwei Objekten messen. Diese Maße erfüllen bestimmte Bedingungen, wie Nichtnegativität, Symmetrie und die Dreiecksungleichung.

Einige bekannte Distanzmaße sind die euklidische Distanz, die Manhattan-Distanz und die Minkowski-Distanz.

Lassen Sie uns die paarweisen Distanzen zwischen zwei Mengen von Proben mit der Funktion pairwise_distances berechnen:

import numpy as np
from sklearn.metrics import pairwise_distances

X = np.array([[2, 3], [3, 5], [5, 8]])
Y = np.array([[1, 0], [2, 1]])

## Calculate pairwise distances between X and Y
distances = pairwise_distances(X, Y, metric='manhattan')
print(distances)

Ausgabe:

array([[4., 2.],
       [7., 5.],
       [12., 10.]])

Kerne

Kerne sind Maße der Ähnlichkeit zwischen zwei Objekten. Sie können in verschiedenen Machine-Learning-Algorithmen verwendet werden, um nicht-lineare Beziehungen zwischen Merkmalen zu erfassen.

Scikit-learn bietet verschiedene Kernfunktionen an, wie die lineare Kernel, die polynomielle Kernel, die sigmoidale Kernel, die RBF-Kernel, die Laplace-Kernel und die chi-quadratische Kernel.

Lassen Sie uns die paarweisen Kerne zwischen zwei Mengen von Proben mit der Funktion pairwise_kernels berechnen:

from sklearn.metrics.pairwise import pairwise_kernels

X = np.array([[2, 3], [3, 5], [5, 8]])
Y = np.array([[1, 0], [2, 1]])

## Calculate pairwise kernels between X and Y using linear kernel
kernels = pairwise_kernels(X, Y, metric='linear')
print(kernels)

Ausgabe:

array([[ 2.,  7.],
       [ 3., 11.],
       [ 5., 18.]])

Cosinusähnlichkeit

Die Cosinusähnlichkeit ist ein Maß für die Ähnlichkeit zwischen zwei Vektoren. Sie berechnet den Kosinus des Winkels zwischen den Vektoren, nachdem diese normalisiert wurden.

Scikit-learn bietet die Funktion cosine_similarity an, um die Cosinusähnlichkeit zwischen Vektoren zu berechnen.

from sklearn.metrics.pairwise import cosine_similarity

X = np.array([[2, 3], [3, 5], [5, 8]])
Y = np.array([[1, 0], [2, 1]])

## Compute cosine similarity between X and Y
similarity = cosine_similarity(X, Y)
print(similarity)

Ausgabe:

array([[0.89442719, 0.9486833 ],
       [0.93982748, 0.99388373],
       [0.99417134, 0.99705449]])

Polynomkernel

Der Polynomkernel berechnet die Ähnlichkeit zwischen zwei Vektoren, indem er die Wechselwirkungen zwischen ihren Dimensionen berücksichtigt.

Scikit-learn bietet die Funktion polynomial_kernel an, um den Polynomkernel zwischen Vektoren zu berechnen.

from sklearn.metrics.pairwise import polynomial_kernel

X = np.array([[2, 3], [3, 5], [5, 8]])
Y = np.array([[1, 0], [2, 1]])

## Compute polynomial kernel between X and Y
kernel = polynomial_kernel(X, Y, degree=2)
print(kernel)

Ausgabe:

array([[ 10.,  20.],
       [ 17.,  37.],
       [ 38.,  82.]])

Zusammenfassung

In diesem Lab haben wir das Untermodul sklearn.metrics.pairwise in scikit-learn untersucht. Wir haben uns mit verschiedenen paarweisen Maßen und Kernen, ihren Definitionen und der Verwendung zur Berechnung von Distanzen und Affinitäten zwischen Proben vertraut gemacht.

Mit der Funktion pairwise_distances haben wir die paarweisen Distanzen zwischen Probenmengen berechnet. Mit der Funktion pairwise_kernels haben wir die paarweisen Kerne zwischen Probenmengen mit verschiedenen Kernfunktionen berechnet.

Wir haben auch die Funktion cosine_similarity zur Berechnung der Cosinusähnlichkeit zwischen Vektoren und die Funktion polynomial_kernel zur Berechnung des Polynomkerns untersucht.

Diese paarweisen Maße und Kerne sind in verschiedenen Machine-Learning-Tasks wie Clustering, Dimensionality Reduction und similarity-based analysis nützlich.

Zusammenfassung

Herzlichen Glückwunsch! Sie haben das Lab zu paarweisen Maßen abgeschlossen. Sie können in LabEx weitere Labs absolvieren, um Ihre Fähigkeiten zu verbessern.