Einführung
Die Hauptkomponentenanalyse (Principal Components Analysis, PCA) ist eine statistische Technik, die zur Vereinfachung von Daten verwendet wird. Es ist eine lineare Transformationsmethode, die die wichtigsten Merkmale oder Muster in den Daten ermittelt. Die PCA wird in der Datenanalyse und im maschinellen Lernen weit verbreitet zur Reduzierung der Dimensionen, zur Datenkompression und zur Merkmalsgewinnung eingesetzt. In diesem Lab verwenden wir die scikit-learn-Bibliothek in Python, um die PCA auf einem Datensatz durchzuführen und die Ergebnisse zu visualisieren.
Tipps für die virtuelle Maschine
Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen von Jupyter Notebook nicht automatisiert werden.
Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.