Pandas DataFrame apply() 메서드

Beginner

소개

이 랩에서는 Python 의 Pandas 라이브러리에서 apply() 메서드를 사용하는 방법을 배웁니다. apply() 메서드를 사용하면 DataFrame 의 각 행 또는 열에 함수를 적용할 수 있으며, 데이터를 계산하거나 변환하는 데 유용합니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

필요한 라이브러리 가져오기

시작하려면 DataFrame 객체와 apply() 메서드를 제공하는 Pandas 라이브러리를 가져와야 합니다. 계산에 필요한 경우 다른 라이브러리도 가져올 수 있습니다.

import pandas as pd

DataFrame 생성

다음으로, 작업할 DataFrame 을 생성해 보겠습니다. Python 리스트 또는 딕셔너리를 사용하여 데이터를 정의할 수 있습니다. 간단하게, 키가 열 이름을 나타내고 값이 데이터를 나타내는 딕셔너리를 사용해 보겠습니다.

data = {
    'Name': ['John', 'Emma', 'David', 'Mary'],
    'Age': [25, 30, 35, 40],
    'Salary': [50000, 60000, 70000, 80000]
}
df = pd.DataFrame(data)
print(df)

함수 정의

이제 DataFrame 에 적용할 수 있는 함수를 정의해 보겠습니다. 이 함수는 DataFrame 의 행 또는 열이 될 단일 매개변수를 받습니다.

def double(x):
    return x * 2

열에 함수 적용

apply() 메서드를 사용하여 정의된 함수를 DataFrame 의 열에 적용할 수 있습니다. 이 예제에서는 double() 함수를 'Salary' 열에 적용해 보겠습니다.

df['Salary'] = df['Salary'].apply(double)
print(df)

행에 함수 적용

apply() 메서드에서 axis=1을 지정하여 함수를 DataFrame 의 행에 적용할 수도 있습니다. 이 예제에서는 double() 함수를 DataFrame 의 각 행에 적용해 보겠습니다.

df = df.apply(double, axis=1)
print(df)

람다 함수 적용

별도의 함수를 정의하는 대신, apply() 메서드와 함께 인라인으로 람다 함수를 사용할 수 있습니다. 람다 함수는 임의의 수의 인수를 받아 결과를 반환할 수 있는 작은 익명 함수입니다. 이 예제에서는 'Age' 열에 람다 함수를 적용하여 각 값의 제곱을 계산해 보겠습니다.

df['Age'] = df['Age'].apply(lambda x: x ** 2)
print(df)

요약

이 랩에서는 Pandas 에서 apply() 메서드를 사용하여 DataFrame 의 각 행 또는 열에 함수를 적용하는 방법을 배웠습니다. 함수를 정의하고 열 또는 행에 적용하는 방법과 apply() 메서드와 함께 람다 함수를 인라인으로 사용하는 방법을 살펴보았습니다. apply() 메서드는 데이터를 계산하거나 변환하는 강력한 도구이며, 데이터 분석 작업을 단순화하는 데 도움이 될 수 있습니다.