Método cov de DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este tutorial, aprenderemos a usar el método DataFrame.cov() de la biblioteca pandas para calcular la covarianza entre columnas en un DataFrame. La covarianza mide la relación entre dos variables aleatorias e indica cuánto varían juntas.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no puede automatizarse debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos rápidamente el problema para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") pandas/ReadingDataGroup -.-> pandas/read_excel("Read Excel") pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/DataAnalysisGroup -.-> pandas/basic_statistics("Basic Statistics") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/numerical_computing("Numerical Computing") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") python/DataScienceandMachineLearningGroup -.-> python/data_visualization("Data Visualization") subgraph Lab Skills pandas/read_csv -.-> lab-68602{{"Método cov de DataFrame de Pandas"}} pandas/read_excel -.-> lab-68602{{"Método cov de DataFrame de Pandas"}} pandas/select_columns -.-> lab-68602{{"Método cov de DataFrame de Pandas"}} python/using_packages -.-> lab-68602{{"Método cov de DataFrame de Pandas"}} pandas/basic_statistics -.-> lab-68602{{"Método cov de DataFrame de Pandas"}} python/data_collections -.-> lab-68602{{"Método cov de DataFrame de Pandas"}} python/numerical_computing -.-> lab-68602{{"Método cov de DataFrame de Pandas"}} python/data_analysis -.-> lab-68602{{"Método cov de DataFrame de Pandas"}} python/data_visualization -.-> lab-68602{{"Método cov de DataFrame de Pandas"}} end

Crear un DataFrame

Primero, creemos un DataFrame con algunos datos de muestra. Usaremos la función pd.DataFrame() para crear un objeto DataFrame.

import pandas as pd

data = {'Name': ['Chetan', 'Yashas', 'Yuvraj'],
        'Age': [20, 25, 30],
        'Height': [155, 170, 165],
        'Weight': [59, 60, 75]}

df = pd.DataFrame(data)
print(df)

Calcular la matriz de covarianza

A continuación, podemos usar el método DataFrame.cov() para calcular la matriz de covarianza de las columnas en el DataFrame. La matriz de covarianza es una matriz en la que cada entrada representa la covarianza entre dos columnas.

covariance_matrix = df.cov()
print(covariance_matrix)

Calcular la covarianza entre dos columnas

Si estamos interesados en calcular la covarianza entre dos columnas específicas, podemos hacerlo accediendo a esas columnas y aplicando directamente el método cov() a ellas.

covariance = df['Height'].cov(df['Weight'])
print(covariance)

Resumen

En este tutorial, aprendimos cómo usar el método DataFrame.cov() de pandas para calcular la covarianza entre columnas en un DataFrame. También vimos cómo calcular la matriz de covarianza de todos los pares de columnas y cómo calcular la covarianza entre dos columnas específicas. La covarianza puede ayudarnos a entender la relación entre diferentes medidas a lo largo del tiempo o cualquier otro conjunto de datos.