Pandas DataFrame 的 corrwith 方法

PythonPythonBeginner
立即练习

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

介绍

在本实验中,我们将学习如何使用 Pandas 库中的 corrwith() 方法来计算两个 DataFrame 之间的成对相关性。

虚拟机使用提示

虚拟机启动完成后,点击左上角切换到 Notebook 标签页,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,随时可以向 Labby 寻求帮助。实验结束后请提供反馈,我们将及时为你解决问题。


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) pandas(("Pandas")) -.-> pandas/AdvancedOperationsGroup(["Advanced Operations"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/DataAnalysisGroup -.-> pandas/basic_statistics("Basic Statistics") pandas/AdvancedOperationsGroup -.-> pandas/merge_data("Merging Data") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/read_csv -.-> lab-68600{{"Pandas DataFrame 的 corrwith 方法"}} python/importing_modules -.-> lab-68600{{"Pandas DataFrame 的 corrwith 方法"}} python/using_packages -.-> lab-68600{{"Pandas DataFrame 的 corrwith 方法"}} pandas/basic_statistics -.-> lab-68600{{"Pandas DataFrame 的 corrwith 方法"}} pandas/merge_data -.-> lab-68600{{"Pandas DataFrame 的 corrwith 方法"}} python/data_collections -.-> lab-68600{{"Pandas DataFrame 的 corrwith 方法"}} python/data_analysis -.-> lab-68600{{"Pandas DataFrame 的 corrwith 方法"}} end

导入必要的库

要使用 corrwith() 方法,我们需要导入 pandas 库。

import pandas as pd

创建 DataFrames

让我们创建两个 DataFrame,用于本实验。

chart_1 = {'Name':['Chetan','yashas','yuvraj'],'Age':  [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df1 = pd.DataFrame(chart_1)

chart_2 = {'Name':['Pooja','Sindu','Renuka'],'Age':  [18,25,20],'Height': [145,155,165],'Weight': [45,55,65]}
df2 = pd.DataFrame(chart_2)

使用 corrwith() 方法计算相关性

我们可以使用 corrwith() 方法来计算两个 DataFrame 之间的相关性。

df1.corrwith(df2)

指定相关性计算方法

默认情况下,corrwith() 方法使用 Pearson 相关系数。然而,我们可以通过 method 参数指定相关性计算方法。

df1.corrwith(df2, method='kendall')

总结

在本实验中,我们学习了如何使用 Pandas 库中的 corrwith() 方法来计算两个 DataFrame 之间的成对相关性。该方法对于查找两个数据集中不同列之间的相关性非常有用。通过指定相关性计算方法,我们可以计算 Pearson、Kendall 或 Spearman 相关系数。这有助于我们理解变量之间的关系,并做出数据驱动的决策。