Einführung
In diesem Lab werden wir lernen, wie man die corrwith()-Methode in der Pandas-Bibliothek verwendet, um die paarweise Korrelation zwischen zwei DataFrames zu berechnen.
Tipps für die virtuelle Maschine
Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.
Importiere die erforderlichen Bibliotheken
Um die corrwith()-Methode zu verwenden, müssen wir die pandas-Bibliothek importieren.
import pandas as pd
Erstelle die DataFrames
Lassen Sie uns zwei DataFrames erstellen, die wir für dieses Lab verwenden werden.
chart_1 = {'Name':['Chetan','yashas','yuvraj'],'Age': [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df1 = pd.DataFrame(chart_1)
chart_2 = {'Name':['Pooja','Sindu','Renuka'],'Age': [18,25,20],'Height': [145,155,165],'Weight': [45,55,65]}
df2 = pd.DataFrame(chart_2)
Berechne die Korrelation mit der corrwith()-Methode
Wir können die corrwith()-Methode verwenden, um die Korrelation zwischen den beiden DataFrames zu berechnen.
df1.corrwith(df2)
Definiere die Korrelationsmethode
Standardmäßig verwendet die corrwith()-Methode den Pearson-Korrelationskoeffizienten. Wir können jedoch die Korrelationsmethode mithilfe des method-Parameters angeben.
df1.corrwith(df2, method='kendall')
Zusammenfassung
In diesem Lab haben wir gelernt, wie man die corrwith()-Methode in der Pandas-Bibliothek verwendet, um die paarweise Korrelation zwischen zwei DataFrames zu berechnen. Diese Methode ist nützlich, um die Korrelation zwischen verschiedenen Spalten in zwei Datensätzen zu finden. Indem wir die Korrelationsmethode angeben, können wir die Pearson-, Kendall- oder Spearman-Korrelationskoeffizienten berechnen. Dies hilft uns, die Beziehungen zwischen Variablen zu verstehen und datengetriebene Entscheidungen zu treffen.