Pandas DataFrame agg 메서드

Beginner

소개

이 랩에서는 pandas 라이브러리의 agg() 메서드를 사용하여 DataFrame 에서 데이터를 집계하는 방법을 배우게 됩니다. 이 메서드를 사용하면 행 또는 열과 같은 지정된 축에서 하나 이상의 연산을 수행할 수 있으며, 선택한 함수에 따라 스칼라, Series 또는 DataFrame 을 반환합니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 연산의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

pandas 라이브러리 가져오기

먼저, import 문을 사용하여 pandas 라이브러리를 가져와야 합니다.

import pandas as pd

DataFrame 생성

다음으로, 작업할 DataFrame 객체를 생성합니다. pd.DataFrame() 함수를 사용하여 목록 또는 배열에서 DataFrame 을 생성할 수 있습니다. 다음은 예시입니다.

df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=['A', 'B', 'C'])

DataFrame 행별 단일 함수 집계

단일 함수를 사용하여 DataFrame 을 집계하려면 agg() 메서드를 사용할 수 있습니다. 문자열 함수 이름 또는 함수 객체를 사용하여 행에 적용하려는 함수를 지정합니다. 다음은 예시입니다.

print("DataFrame 의 값 합계 출력")
print(df.agg(["sum"]))

DataFrame 열별 단일 함수 집계

열 (columns) 에 단일 함수를 사용하여 DataFrame 을 집계하려면 axis 매개변수를 'columns'로 설정합니다. 이렇게 하면 각 행 대신 각 열에 함수가 적용됩니다. 다음은 예시입니다.

print("DataFrame 의 최소값 출력")
print(df.agg(["min"], axis='columns'))

DataFrame 행 및 열에 대한 함수 목록 집계

함수 목록을 사용하여 DataFrame 을 집계할 수도 있습니다. 이렇게 하면 행 또는 열에 대해 여러 작업을 수행할 수 있습니다. 다음은 예시입니다.

print("기본 축 (axis) 으로 DataFrame 의 합계와 최소값 출력")
print(df.agg(["sum", "min"]))

DataFrame 열별 다양한 함수 집계

더 많은 유연성을 위해, 열 이름과 해당 함수로 구성된 딕셔너리를 agg() 메서드에 전달할 수 있습니다. 이렇게 하면 서로 다른 열에 서로 다른 함수를 적용할 수 있습니다. 다음은 예시입니다.

print("열에 대한 서로 다른 집계 함수 출력")
print(df.agg({'A': ["sum"], 'B': ["min", "max"], 'C': ["count"]}))

요약

이 랩에서는 pandas 의 agg() 메서드를 사용하여 DataFrame 의 데이터를 집계하는 방법을 배웠습니다. 이제 DataFrame 의 행과 열에 단일 및 다중 함수를 적용하는 방법을 알게 되었습니다. 이 메서드는 데이터를 대상으로 다양한 집계 작업을 수행하는 데 유용합니다. DataFrame 을 분석하고 요약하기 위해 다양한 함수와 축 (axis) 을 실험해 보세요. 즐거운 분석 되세요!