Pandas DataFrame Corr 메서드

Beginner

소개

이 랩에서는 pandas 라이브러리의 corr() 메서드를 사용하여 DataFrame 의 열 간 상관 관계를 계산하는 방법을 배웁니다. 상관 관계는 두 변수 간의 선형 관계를 측정하는 지표이며, 한 변수의 변화가 다른 변수에 어떤 영향을 미치는지 이해하는 데 도움이 됩니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

필요한 라이브러리 가져오기

먼저, 필요한 라이브러리를 가져와야 합니다. 이 경우, pandas 라이브러리만 필요합니다.

import pandas as pd

DataFrame 생성

다음으로, 작업할 DataFrame 을 생성해 보겠습니다. 사람들의 이름, 나이, 키 및 몸무게를 나타내는 열이 있는 간단한 DataFrame 을 생성합니다.

chart = {
    'Name':['Chetan','yashas','yuvraj'],
    'Age':  [20, 25, 30],
    'Height': [155, 160, 175],
    'Weight': [55, 60, 75]
}

df = pd.DataFrame(chart)

상관관계 계산

이제 corr() 메서드를 사용하여 DataFrame 의 열 간의 상관 관계를 계산할 수 있습니다. 선택적 method 매개변수를 제공하여 사용할 상관 관계 방법 ( pearson, kendall, 또는 spearman) 을 지정할 수 있습니다. 메서드가 지정되지 않으면 기본적으로 Pearson 상관 관계가 사용됩니다.

DataFrame 의 열 간의 Pearson 상관 관계를 계산해 보겠습니다.

pearson_corr = df.corr(method='pearson')
print("Pearson Correlation:")
print(pearson_corr)

상관관계 시각화

히트맵을 사용하여 상관 관계 행렬을 시각화할 수 있습니다. seaborn 라이브러리는 히트맵을 생성하는 편리한 방법을 제공합니다.

import seaborn as sns
import matplotlib.pyplot as plt

sns.heatmap(pearson_corr, annot=True, cmap='coolwarm')
plt.title("Pearson Correlation Heatmap")
plt.show()

다른 방법으로 상관관계 계산

Kendall 또는 Spearman 방법을 사용하여 상관 관계를 계산할 수도 있습니다. 이렇게 하려면 method 매개변수를 적절하게 지정하기만 하면 됩니다. DataFrame 의 Kendall 상관 관계를 계산해 보겠습니다.

kendall_corr = df.corr(method='kendall')
print("Kendall Correlation:")
print(kendall_corr)

다른 방법으로 상관관계 히트맵 시각화

마찬가지로, Kendall 및 Spearman 상관 관계를 시각화하기 위해 히트맵을 생성할 수 있습니다.

sns.heatmap(kendall_corr, annot=True, cmap='coolwarm')
plt.title("Kendall Correlation Heatmap")
plt.show()

스피어만 상관관계로 프로세스 반복

마지막으로, Spearman 상관 관계를 계산하고 시각화해 보겠습니다.

spearman_corr = df.corr(method='spearman')
print("Spearman Correlation:")
print(spearman_corr)
sns.heatmap(spearman_corr, annot=True, cmap='coolwarm')
plt.title("Spearman Correlation Heatmap")
plt.show()

요약

이 랩에서는 pandas 의 corr() 메서드를 사용하여 DataFrame 열 간의 상관 관계를 계산하고 시각화하는 방법을 배웠습니다. Pearson, Kendall 및 Spearman 을 포함한 다양한 상관 관계 방법을 탐구하고 히트맵을 사용하여 상관 관계 행렬을 시각화했습니다. 상관 관계 분석은 변수 간의 관계를 식별하는 데 도움이 되며 데이터 분석, 머신 러닝 및 금융과 같은 많은 분야에서 유용합니다.