Метод cov для DataFrame в Pandas

Beginner

Введение

В этом руководстве мы узнаем, как использовать метод DataFrame.cov() из библиотеки pandas для вычисления ковариации между столбцами в DataFrame. Ковариация измеряет связь между двумя случайными переменными и показывает, насколько они изменяются вместе.

Советы по работе с ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Создать DataFrame

Сначала создадим DataFrame с некоторыми примерами данных. Для этого используем функцию pd.DataFrame() для создания объекта DataFrame.

import pandas as pd

data = {'Name': ['Chetan', 'Yashas', 'Yuvraj'],
        'Age': [20, 25, 30],
        'Height': [155, 170, 165],
        'Weight': [59, 60, 75]}

df = pd.DataFrame(data)
print(df)

Вычислить ковариационную матрицу

Далее мы можем использовать метод DataFrame.cov() для вычисления ковариационной матрицы столбцов в DataFrame. Ковариационная матрица - это матрица, в которой каждый элемент представляет ковариацию между двумя столбцами.

covariance_matrix = df.cov()
print(covariance_matrix)

Вычислить ковариацию двух столбцов

Если мы хотим вычислить ковариацию между двумя конкретными столбцами, мы можем сделать это, обратившись к этим столбцам и напрямую применяя метод cov() к ним.

covariance = df['Height'].cov(df['Weight'])
print(covariance)

Резюме

В этом руководстве мы узнали, как использовать метод DataFrame.cov() в pandas для вычисления ковариации между столбцами в DataFrame. Мы также увидели, как вычислить ковариационную матрицу для всех пар столбцов и как вычислить ковариацию между двумя конкретными столбцами. Ковариация может помочь нам понять связь между различными показателями в течение времени или между любыми другими точками данных.