Méthode cov() du DataFrame Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce tutoriel, nous allons apprendre à utiliser la méthode DataFrame.cov() de la bibliothèque pandas pour calculer la covariance entre les colonnes d'un DataFrame. La covariance mesure la relation entre deux variables aléatoires et indique dans quelle mesure elles varient ensemble.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Créer un DataFrame

Tout d'abord, créons un DataFrame avec quelques données d'échantillonnage. Nous allons utiliser la fonction pd.DataFrame() pour créer un objet DataFrame.

import pandas as pd

data = {'Name': ['Chetan', 'Yashas', 'Yuvraj'],
        'Age': [20, 25, 30],
        'Height': [155, 170, 165],
        'Weight': [59, 60, 75]}

df = pd.DataFrame(data)
print(df)

Calculer la matrice de covariance

Ensuite, nous pouvons utiliser la méthode DataFrame.cov() pour calculer la matrice de covariance des colonnes dans le DataFrame. La matrice de covariance est une matrice dans laquelle chaque entrée représente la covariance entre deux colonnes.

covariance_matrix = df.cov()
print(covariance_matrix)

Calculer la covariance entre deux colonnes

Si nous sommes intéressés par le calcul de la covariance entre deux colonnes spécifiques, nous pouvons le faire en accédant à ces colonnes et en appliquant directement la méthode cov() à celles-ci.

covariance = df['Height'].cov(df['Weight'])
print(covariance)

Sommaire

Dans ce tutoriel, nous avons appris à utiliser la méthode DataFrame.cov() de pandas pour calculer la covariance entre les colonnes d'un DataFrame. Nous avons également vu comment calculer la matrice de covariance de toutes les paires de colonnes et comment calculer la covariance entre deux colonnes spécifiques. La covariance peut nous aider à comprendre la relation entre différentes mesures au fil du temps ou à travers tout autre ensemble de points de données.