Méthode corrwith() des DataFrames Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode corrwith() de la bibliothèque Pandas pour calculer la corrélation paire à paire entre deux DataFrames.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous réglerons rapidement le problème pour vous.

Importez les bibliothèques nécessaires

Pour utiliser la méthode corrwith(), nous devons importer la bibliothèque pandas.

import pandas as pd

Créez les DataFrames

Créeons deux DataFrames que nous utiliserons pour ce laboratoire.

chart_1 = {'Name':['Chetan','yashas','yuvraj'],'Age':  [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df1 = pd.DataFrame(chart_1)

chart_2 = {'Name':['Pooja','Sindu','Renuka'],'Age':  [18,25,20],'Height': [145,155,165],'Weight': [45,55,65]}
df2 = pd.DataFrame(chart_2)

Calculez la corrélation en utilisant la méthode corrwith()

Nous pouvons utiliser la méthode corrwith() pour calculer la corrélation entre les deux DataFrames.

df1.corrwith(df2)

Spécifiez la méthode de corrélation

Par défaut, la méthode corrwith() utilise le coefficient de corrélation de Pearson. Cependant, nous pouvons spécifier la méthode de corrélation en utilisant le paramètre method.

df1.corrwith(df2, method='kendall')

Sommaire

Dans ce laboratoire, nous avons appris à utiliser la méthode corrwith() dans la bibliothèque Pandas pour calculer la corrélation paire à paire entre deux DataFrames. Cette méthode est utile pour trouver la corrélation entre différentes colonnes dans deux ensembles de données. En spécifiant la méthode de corrélation, nous pouvons calculer les coefficients de corrélation de Pearson, Kendall ou Spearman. Cela nous aide à comprendre les relations entre les variables et à prendre des décisions basées sur les données.