Введение
В этом руководстве мы узнаем, как использовать метод DataFrame.cov() из библиотеки pandas для вычисления ковариации между столбцами в DataFrame. Ковариация измеряет связь между двумя случайными переменными и показывает, насколько они изменяются вместе.
Советы по работе с ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Создать DataFrame
Сначала создадим DataFrame с некоторыми примерами данных. Для этого используем функцию pd.DataFrame() для создания объекта DataFrame.
import pandas as pd
data = {'Name': ['Chetan', 'Yashas', 'Yuvraj'],
'Age': [20, 25, 30],
'Height': [155, 170, 165],
'Weight': [59, 60, 75]}
df = pd.DataFrame(data)
print(df)
Вычислить ковариационную матрицу
Далее мы можем использовать метод DataFrame.cov() для вычисления ковариационной матрицы столбцов в DataFrame. Ковариационная матрица - это матрица, в которой каждый элемент представляет ковариацию между двумя столбцами.
covariance_matrix = df.cov()
print(covariance_matrix)
Вычислить ковариацию двух столбцов
Если мы хотим вычислить ковариацию между двумя конкретными столбцами, мы можем сделать это, обратившись к этим столбцам и напрямую применяя метод cov() к ним.
covariance = df['Height'].cov(df['Weight'])
print(covariance)
Резюме
В этом руководстве мы узнали, как использовать метод DataFrame.cov() в pandas для вычисления ковариации между столбцами в DataFrame. Мы также увидели, как вычислить ковариационную матрицу для всех пар столбцов и как вычислить ковариацию между двумя конкретными столбцами. Ковариация может помочь нам понять связь между различными показателями в течение времени или между любыми другими точками данных.