Introducción
En este laboratorio, aprenderemos a usar el método corrwith() de la biblioteca Pandas para calcular la correlación par a par entre dos DataFrames.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Importar las bibliotecas necesarias
Para usar el método corrwith(), necesitamos importar la biblioteca pandas.
import pandas as pd
Crear los DataFrames
Vamos a crear dos DataFrames que usaremos para este laboratorio.
chart_1 = {'Name':['Chetan','yashas','yuvraj'],'Age': [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df1 = pd.DataFrame(chart_1)
chart_2 = {'Name':['Pooja','Sindu','Renuka'],'Age': [18,25,20],'Height': [145,155,165],'Weight': [45,55,65]}
df2 = pd.DataFrame(chart_2)
Calcular la correlación utilizando el método corrwith()
Podemos usar el método corrwith() para calcular la correlación entre los dos DataFrames.
df1.corrwith(df2)
Especificar el método de correlación
Por defecto, el método corrwith() utiliza el coeficiente de correlación de Pearson. Sin embargo, podemos especificar el método de correlación usando el parámetro method.
df1.corrwith(df2, method='kendall')
Resumen
En este laboratorio, aprendimos cómo usar el método corrwith() en la biblioteca Pandas para calcular la correlación par a par entre dos DataFrames. Este método es útil para encontrar la correlación entre diferentes columnas en dos conjuntos de datos. Al especificar el método de correlación, podemos calcular los coeficientes de correlación de Pearson, Kendall o Spearman. Esto nos ayuda a entender las relaciones entre las variables y tomar decisiones basadas en datos.