Pandas DataFrame Cov Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Tutorial lernen wir, wie wir die DataFrame.cov()-Methode in der pandas-Bibliothek verwenden, um die Kovarianz zwischen Spalten in einem DataFrame zu berechnen. Die Kovarianz misst die Beziehung zwischen zwei Zufallsvariablen und zeigt an, wie stark sie zusammen variieren.

Tipps für die virtuelle Maschine

Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") pandas/ReadingDataGroup -.-> pandas/read_excel("Read Excel") pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/DataAnalysisGroup -.-> pandas/basic_statistics("Basic Statistics") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/numerical_computing("Numerical Computing") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") python/DataScienceandMachineLearningGroup -.-> python/data_visualization("Data Visualization") subgraph Lab Skills pandas/read_csv -.-> lab-68602{{"Pandas DataFrame Cov Methode"}} pandas/read_excel -.-> lab-68602{{"Pandas DataFrame Cov Methode"}} pandas/select_columns -.-> lab-68602{{"Pandas DataFrame Cov Methode"}} python/using_packages -.-> lab-68602{{"Pandas DataFrame Cov Methode"}} pandas/basic_statistics -.-> lab-68602{{"Pandas DataFrame Cov Methode"}} python/data_collections -.-> lab-68602{{"Pandas DataFrame Cov Methode"}} python/numerical_computing -.-> lab-68602{{"Pandas DataFrame Cov Methode"}} python/data_analysis -.-> lab-68602{{"Pandas DataFrame Cov Methode"}} python/data_visualization -.-> lab-68602{{"Pandas DataFrame Cov Methode"}} end

Erstellen eines DataFrames

Zunächst erstellen wir ein DataFrame mit einigen Beispiel-Daten. Wir verwenden die pd.DataFrame()-Funktion, um ein DataFrame-Objekt zu erstellen.

import pandas as pd

data = {'Name': ['Chetan', 'Yashas', 'Yuvraj'],
        'Age': [20, 25, 30],
        'Height': [155, 170, 165],
        'Weight': [59, 60, 75]}

df = pd.DataFrame(data)
print(df)

Kovarianzmatrix berechnen

Als nächstes können wir die DataFrame.cov()-Methode verwenden, um die Kovarianzmatrix der Spalten im DataFrame zu berechnen. Die Kovarianzmatrix ist eine Matrix, in der jeder Eintrag die Kovarianz zwischen zwei Spalten darstellt.

covariance_matrix = df.cov()
print(covariance_matrix)

Kovarianz zwischen zwei Spalten berechnen

Wenn wir die Kovarianz zwischen zwei bestimmten Spalten berechnen möchten, können wir dies tun, indem wir auf diese Spalten zugreifen und direkt die cov()-Methode auf sie anwenden.

covariance = df['Height'].cov(df['Weight'])
print(covariance)

Zusammenfassung

In diesem Tutorial haben wir gelernt, wie wir die DataFrame.cov()-Methode in pandas verwenden, um die Kovarianz zwischen Spalten in einem DataFrame zu berechnen. Wir haben auch gesehen, wie man die Kovarianzmatrix aller Spaltenpaare berechnet und wie man die Kovarianz zwischen zwei bestimmten Spalten berechnet. Die Kovarianz kann uns dabei helfen, die Beziehung zwischen verschiedenen Maßen über die Zeit oder andere Datenpunkte zu verstehen.