소개
이 랩에서는 pandas 라이브러리의 combine() 메서드를 사용하여 두 DataFrame 을 열 방향으로 결합하는 방법을 배웁니다. combine() 메서드를 사용하면 지정된 함수를 사용하여 한 DataFrame 의 열을 다른 DataFrame 과 병합할 수 있습니다.
VM 팁
VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.
때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.
학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.
pandas 라이브러리 가져오기
먼저, 데이터 조작 및 분석을 위한 강력한 라이브러리인 pandas 라이브러리를 가져와야 합니다.
import pandas as pd
DataFrame 생성하기
다음으로, combine() 메서드를 시연하는 데 사용할 두 개의 DataFrame 을 생성해 보겠습니다.
df1 = pd.DataFrame({'A': [2, 0, 5], 'B': [2, None, -0.25]})
df2 = pd.DataFrame({'A': [3, 1, None], 'B': [3, 3, -4]})
DataFrame 의 내용을 확인하기 위해 출력해 보겠습니다.
print("DataFrame 1:")
print(df1)
print("\nDataFrame 2:")
print(df2)
출력:
DataFrame 1:
A B
0 2 2.00
1 0 NaN
2 5 -0.25
DataFrame 2:
A B
0 3.0 3
1 1.0 3
2 NaN -4
combine() 메서드를 사용하여 DataFrame 결합하기
이제 combine() 메서드를 사용하여 두 DataFrame 을 결합해 보겠습니다.
combined_df = df1.combine(df2, min)
min 함수는 두 열 사이에서 더 작은 값을 선택하기 위해 func 매개변수로 사용됩니다.
결과를 확인하기 위해 결합된 DataFrame 을 출력해 보겠습니다.
print("\nCombined DataFrame:")
print(combined_df)
출력:
Combined DataFrame:
A B
0 2.0 2.00
1 0.0 NaN
2 5.0 -4.00
사용자 정의 함수로 DataFrame 결합
DataFrame 을 결합하기 위해 func 매개변수로 사용자 정의 함수를 사용할 수도 있습니다. 각 열의 값을 곱하는 사용자 정의 함수 multiply_columns를 만들어 보겠습니다.
def multiply_columns(s1, s2):
return s1 * s2
combined_df = df1.combine(df2, multiply_columns)
결과를 확인하기 위해 결합된 DataFrame 을 출력해 보겠습니다.
print("\nCombined DataFrame:")
print(combined_df)
출력:
Combined DataFrame:
A B
0 6.0 6.0
1 0.0 NaN
2 NaN 1.0
요약
이 랩에서는 pandas 의 combine() 메서드를 사용하여 두 DataFrame 을 열 방향으로 결합하는 방법을 배웠습니다. 내장 함수와 사용자 정의 함수를 사용하여 열을 병합하는 방법을 살펴보았습니다. combine() 메서드는 특정 조건이나 규칙에 따라 두 DataFrame 의 열을 병합하려는 경우 유용합니다. 데이터를 결합하는 방식에 유연성을 제공하며 필요한 경우 누락된 값을 채웁니다.