소개
이 랩에서는 Python 의 Pandas 라이브러리에서 assign() 메서드를 사용하는 방법을 배웁니다. assign() 메서드를 사용하면 DataFrame 에 새로운 열을 추가할 수 있으며, 새로운 열과 함께 모든 원래 열을 포함하는 새로운 DataFrame 객체를 반환합니다. 새로운 열을 직접 할당하거나 함수 또는 표현식을 사용하여 할당할 수 있습니다.
VM 팁
VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.
때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.
학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.
필요한 라이브러리 가져오기
먼저, 필요한 라이브러리인 pandas와 numpy를 가져오겠습니다.
import pandas as pd
import numpy as np
DataFrame 생성
다음으로, 몇 가지 샘플 데이터를 포함하는 DataFrame 을 생성해 보겠습니다. pd.DataFrame() 함수를 사용하여 딕셔너리에서 DataFrame 을 생성합니다.
data = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)
print(df)
출력 결과는 다음과 같습니다.
A B
0 1 6
1 2 7
2 3 8
3 4 9
4 5 10
DataFrame 에 새로운 열 할당
이제 assign() 메서드를 사용하여 DataFrame 에 새로운 열을 할당해 보겠습니다. 열 이름과 값을 지정하여 새로운 열을 직접 할당할 수 있습니다.
df = df.assign(C=[11, 12, 13, 14, 15])
print(df)
출력 결과는 다음과 같습니다.
A B C
0 1 6 11
1 2 7 12
2 3 8 13
3 4 9 14
4 5 10 15
함수를 사용하여 새로운 열 할당
assign() 메서드에 함수를 전달하여 DataFrame 에 새로운 열을 할당할 수도 있습니다. 이 함수는 DataFrame 을 입력으로 받아 새로운 열의 값을 생성하기 위한 계산을 수행합니다. C에 1 을 더한 값을 계산하는 새로운 열 D를 할당해 보겠습니다.
df = df.assign(D=lambda x: x['C'] + 1)
print(df)
출력 결과는 다음과 같습니다.
A B C D
0 1 6 11 12
1 2 7 12 13
2 3 8 13 14
3 4 9 14 15
4 5 10 15 16
DataFrame 에 여러 열 할당
assign() 메서드를 여러 번 사용하여 DataFrame 에 여러 열을 할당할 수 있습니다. DataFrame 에 두 개의 새로운 열 E와 F를 할당해 보겠습니다. 열 E는 A에 1 을 더한 값을 계산하고, 열 F는 B에서 1 을 뺀 값을 계산합니다.
df = df.assign(E=lambda x: x['A'] + 1).assign(F=lambda x: x['B'] - 1)
print(df)
출력 결과는 다음과 같습니다.
A B C D E F
0 1 6 11 12 2 5
1 2 7 12 13 3 6
2 3 8 13 14 4 7
3 4 9 14 15 5 8
4 5 10 15 16 6 9
요약
이 랩에서는 Pandas 의 assign() 메서드를 사용하여 DataFrame 에 새로운 열을 추가하는 방법을 배웠습니다. 새로운 열을 직접 할당하거나 함수 또는 표현식을 사용하여 할당할 수 있습니다. 이 방법을 사용하면 원본 데이터를 변경하지 않고도 DataFrame 을 쉽게 조작하고 수정할 수 있습니다.