Introduction
Dans ce laboratoire, nous allons apprendre à utiliser la méthode corrwith() de la bibliothèque Pandas pour calculer la corrélation paire à paire entre deux DataFrames.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous réglerons rapidement le problème pour vous.
Importer les bibliothèques nécessaires
Pour utiliser la méthode corrwith(), nous devons importer la bibliothèque pandas.
import pandas as pd
Créer les DataFrames
Créeons deux DataFrames que nous utiliserons pour ce laboratoire.
chart_1 = {'Name':['Chetan','yashas','yuvraj'],'Age': [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df1 = pd.DataFrame(chart_1)
chart_2 = {'Name':['Pooja','Sindu','Renuka'],'Age': [18,25,20],'Height': [145,155,165],'Weight': [45,55,65]}
df2 = pd.DataFrame(chart_2)
Calculer la corrélation en utilisant la méthode corrwith()
Nous pouvons utiliser la méthode corrwith() pour calculer la corrélation entre les deux DataFrames.
df1.corrwith(df2)
Spécifier la méthode de corrélation
Par défaut, la méthode corrwith() utilise le coefficient de corrélation de Pearson. Cependant, nous pouvons spécifier la méthode de corrélation en utilisant le paramètre method.
df1.corrwith(df2, method='kendall')
Résumé
Dans ce laboratoire, nous avons appris à utiliser la méthode corrwith() dans la bibliothèque Pandas pour calculer la corrélation paire à paire entre deux DataFrames. Cette méthode est utile pour trouver la corrélation entre différentes colonnes dans deux ensembles de données. En spécifiant la méthode de corrélation, nous pouvons calculer les coefficients de corrélation de Pearson, Kendall ou Spearman. Cela nous aide à comprendre les relations entre les variables et à prendre des décisions basées sur les données.