Pandas DataFrame 피벗 테이블 마스터하기

소개

이 랩에서는 Python pandas 라이브러리의 pivot_table() 메서드에 대해 배우겠습니다. pivot_table() 메서드는 DataFrame 의 데이터를 집계하고 요약하는 데 사용됩니다. 이 메서드는 스프레드시트 스타일의 피벗 테이블을 새로운 DataFrame 으로 반환합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리를 가져오고 DataFrame 생성

먼저, pandas 라이브러리를 가져오고 몇 가지 샘플 데이터로 DataFrame 을 생성해 보겠습니다. 'Date', 'State', 'Temperature', 'Humidity' 열을 가진 DataFrame 을 생성합니다.

import pandas as pd

df = pd.DataFrame({'Date': ['1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021', '1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021'],
                   'State': ['Karnataka', 'Karnataka', 'Karnataka', 'Karnataka', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu'],
                   'Temperature': [25, 29, 28, 31, 26, 27, 22, 32],
                   'Humidity': [46, 50, 52, 59, 42, 45, 46, 43]})

pivot_table() 메서드를 사용하여 DataFrame 집계

pivot_table() 메서드를 사용하여 DataFrame 의 데이터를 집계하려면, 인덱스 (index), 열 (columns) 로 사용할 열과 집계할 값을 지정해야 합니다.

pivot_df = df.pivot_table(index='Date', columns='State', aggfunc='mean')

결과 DataFrame 표시

마지막으로, 결과 피벗 테이블 DataFrame 을 표시해 보겠습니다.

print(pivot_df)

요약

이러한 단계를 따라, pandas 라이브러리의 pivot_table() 메서드를 사용하여 DataFrame 의 데이터를 집계하고 요약할 수 있었습니다. 이 메서드는 데이터를 표 형식으로 분석하고 시각화하는 데 유용합니다. 결과 피벗 테이블 DataFrame 은 서로 다른 인덱스와 열을 기반으로 집계된 값을 편리하게 확인할 수 있는 방법을 제공합니다.

Pandas DataFrame 피벗 테이블 메서드

소개

VM 팁

필요한 라이브러리를 가져오고 DataFrame 생성

pivot_table() 메서드를 사용하여 DataFrame 집계

결과 DataFrame 표시

요약