Método corrwith de DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos a usar el método corrwith() de la biblioteca Pandas para calcular la correlación par a par entre dos DataFrames.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/AdvancedOperationsGroup(["Advanced Operations"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/DataAnalysisGroup -.-> pandas/basic_statistics("Basic Statistics") pandas/AdvancedOperationsGroup -.-> pandas/merge_data("Merging Data") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/read_csv -.-> lab-68600{{"Método corrwith de DataFrame de Pandas"}} python/importing_modules -.-> lab-68600{{"Método corrwith de DataFrame de Pandas"}} python/using_packages -.-> lab-68600{{"Método corrwith de DataFrame de Pandas"}} pandas/basic_statistics -.-> lab-68600{{"Método corrwith de DataFrame de Pandas"}} pandas/merge_data -.-> lab-68600{{"Método corrwith de DataFrame de Pandas"}} python/data_collections -.-> lab-68600{{"Método corrwith de DataFrame de Pandas"}} python/data_analysis -.-> lab-68600{{"Método corrwith de DataFrame de Pandas"}} end

Importar las bibliotecas necesarias

Para usar el método corrwith(), necesitamos importar la biblioteca pandas.

import pandas as pd

Crear los DataFrames

Vamos a crear dos DataFrames que usaremos para este laboratorio.

chart_1 = {'Name':['Chetan','yashas','yuvraj'],'Age':  [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df1 = pd.DataFrame(chart_1)

chart_2 = {'Name':['Pooja','Sindu','Renuka'],'Age':  [18,25,20],'Height': [145,155,165],'Weight': [45,55,65]}
df2 = pd.DataFrame(chart_2)

Calcular la correlación usando el método corrwith()

Podemos usar el método corrwith() para calcular la correlación entre los dos DataFrames.

df1.corrwith(df2)

Especificar el método de correlación

Por defecto, el método corrwith() utiliza el coeficiente de correlación de Pearson. Sin embargo, podemos especificar el método de correlación usando el parámetro method.

df1.corrwith(df2, method='kendall')

Resumen

En este laboratorio, aprendimos cómo usar el método corrwith() en la biblioteca Pandas para calcular la correlación par a par entre dos DataFrames. Este método es útil para encontrar la correlación entre diferentes columnas en dos conjuntos de datos. Al especificar el método de correlación, podemos calcular los coeficientes de correlación de Pearson, Kendall o Spearman. Esto nos ayuda a entender las relaciones entre las variables y tomar decisiones basadas en datos.