Farbquantisierung mit K-Means

Machine LearningMachine LearningBeginner
Jetzt üben

This tutorial is from open-source community. Access the source code

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

Die Farbquantisierung ist ein Prozess, bei dem die Anzahl der unterschiedlichen Farben in einem Bild reduziert wird, während das allgemeine Aussehen erhalten bleibt. Dies wird durch Gruppieren ähnlicher Farben zusammen und Darstellung derselben mit einem einzelnen Farbwert erreicht. In diesem Lab verwenden wir den K-Means-Clustering-Algorithmus, um die Farbquantisierung auf einem Bild des Sommerpalaasts in China durchzuführen.

Tipps für die VM

Nachdem der Start der VM abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen von Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.

Originalbild laden und anzeigen

Wir beginnen mit dem Laden und Anzeigen des Originalbilds des Sommerpalaasts.

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_sample_image

## Lade das Sommerpalast-Foto
china = load_sample_image("china.jpg")

## Zeige das Originalbild an
plt.figure()
plt.axis("off")
plt.title("Originalbild")
plt.imshow(china)
plt.show()

Bild in Floats umwandeln und umformen

Wir werden das Bild in Floats umwandeln und es in ein 2D-Numpy-Array umformen, damit es vom K-Means-Algorithmus verarbeitet werden kann.

## Konvertiere zu Floats anstelle der standardmäßigen 8-Bit-Ganzzahl-Codierung.
china = np.array(china, dtype=np.float64) / 255

## Ermittle die Dimensionen des Bilds
w, h, d = original_shape = tuple(china.shape)
assert d == 3

## Forme das Bild in ein 2D-Numpy-Array um
image_array = np.reshape(china, (w * h, d))

K-Means-Modell anpassen

Wir werden das K-Means-Modell an einem kleinen Teilstichproben der Bilddaten anpassen und es verwenden, um Farb-Indizes für das gesamte Bild vorherzusagen.

from sklearn.cluster import KMeans
from sklearn.utils import shuffle
from time import time

n_colors = 64

## Passt das K-Means-Modell an einem kleinen Teilstichproben der Daten an
print("Anpassen des Modells an einem kleinen Teilstichproben der Daten")
t0 = time()
image_array_sample = shuffle(image_array, random_state=0, n_samples=1000)
kmeans = KMeans(n_clusters=n_colors, n_init="auto", random_state=0).fit(
    image_array_sample
)
print(f"fertig in {time() - t0:0.3f}s.")

## Holt die Labels für alle Punkte
print("Vorhersagen von Farb-Indizes für das gesamte Bild (k-means)")
t0 = time()
labels = kmeans.predict(image_array)
print(f"fertig in {time() - t0:0.3f}s.")

Farb-Indizes mit einem zufälligen Codebuch vorhersagen

Wir werden die Farb-Indizes für das gesamte Bild mit einem zufälligen Codebuch vorherzusagen.

## Holt ein zufälliges Codebuch
codebook_random = shuffle(image_array, random_state=0, n_samples=n_colors)

## Vorhersagt die Farb-Indizes für das gesamte Bild mit dem zufälligen Codebuch
print("Vorhersagen von Farb-Indizes für das gesamte Bild (zufällig)")
t0 = time()
labels_random = pairwise_distances_argmin(codebook_random, image_array, axis=0)
print(f"fertig in {time() - t0:0.3f}s.")

Das Bild neu erstellen

Wir werden das komprimierte Bild mithilfe des Codebuchs und der Labels, die aus dem K-Means-Modell und dem zufälligen Codebuch erhalten wurden, neu erstellen.

def recreate_image(codebook, labels, w, h):
    """Neuerstellt das (komprimierte) Bild aus dem Codebuch & den Labels"""
    return codebook[labels].reshape(w, h, -1)

## Zeigt das Originalbild neben den quantisierten Bildern an
plt.figure()
plt.clf()
plt.axis("off")
plt.title("Originalbild (96.615 Farben)")
plt.imshow(china)

plt.figure()
plt.clf()
plt.axis("off")
plt.title(f"Quantisiertes Bild ({n_colors} Farben, K-Means)")
plt.imshow(recreate_image(kmeans.cluster_centers_, labels, w, h))

plt.figure()
plt.clf()
plt.axis("off")
plt.title(f"Quantisiertes Bild ({n_colors} Farben, Zufällig)")
plt.imshow(recreate_image(codebook_random, labels_random, w, h))

plt.show()

Zusammenfassung

In diesem Lab haben wir gelernt, wie man den K-Means-Clustering-Algorithmus verwendet, um eine Farbquantisierung auf einem Bild durchzuführen. Wir haben das Originalbild geladen und angezeigt, es in Floats umgewandelt und in ein 2D-Numpy-Array umgeformt. Wir haben das K-Means-Modell an einer Teilstichprobe der Bilddaten angepasst und es verwendet, um Farb-Indizes für das gesamte Bild vorherzusagen. Wir haben auch Farb-Indizes für das gesamte Bild mit einem zufälligen Codebuch vorhergesagt. Schließlich haben wir das komprimierte Bild mithilfe des Codebuchs und der Labels, die aus dem K-Means-Modell und dem zufälligen Codebuch erhalten wurden, neu erstellt und das Originalbild neben den quantisierten Bildern angezeigt.