Метод corrwith для DataFrame в Pandas

Beginner

Введение

В этом практическом занятии мы научимся использовать метод corrwith() из библиотеки Pandas для вычисления попарной корреляции между двумя DataFrame.

Советы по использованию ВМ

После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Ноутбук и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортировать необходимые библиотеки

Для использования метода corrwith() нам необходимо импортировать библиотеку pandas.

import pandas as pd

Создать DataFrame

Создадим два DataFrame, которые будем использовать в этом практическом занятии.

chart_1 = {'Name':['Chetan','yashas','yuvraj'],'Age':  [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df1 = pd.DataFrame(chart_1)

chart_2 = {'Name':['Pooja','Sindu','Renuka'],'Age':  [18,25,20],'Height': [145,155,165],'Weight': [45,55,65]}
df2 = pd.DataFrame(chart_2)

Вычислить корреляцию с использованием метода corrwith()

Мы можем использовать метод corrwith() для вычисления корреляции между двумя DataFrame.

df1.corrwith(df2)

Указать метод корреляции

По умолчанию метод corrwith() использует коэффициент корреляции Пирсона. Однако, мы можем указать метод корреляции, используя параметр method.

df1.corrwith(df2, method='kendall')

Резюме

В этом практическом занятии мы узнали, как использовать метод corrwith() в библиотеке Pandas для вычисления попарной корреляции между двумя DataFrame. Этот метод полезен для нахождения корреляции между разными столбцами в двух наборах данных. Задав метод корреляции, мы можем вычислить коэффициенты корреляции Пирсона, Кендалла или Спирмена. Это помогает нам понять связи между переменными и принимать решения на основе данных.