Pandas DataFrame 결합 메서드

Beginner

소개

이 랩에서는 pandas 라이브러리의 combine() 메서드를 사용하여 두 DataFrame 을 열 방향으로 결합하는 방법을 배웁니다. combine() 메서드를 사용하면 지정된 함수를 사용하여 한 DataFrame 의 열을 다른 DataFrame 과 병합할 수 있습니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

pandas 라이브러리 가져오기

먼저, 데이터 조작 및 분석을 위한 강력한 라이브러리인 pandas 라이브러리를 가져와야 합니다.

import pandas as pd

DataFrame 생성하기

다음으로, combine() 메서드를 시연하는 데 사용할 두 개의 DataFrame 을 생성해 보겠습니다.

df1 = pd.DataFrame({'A': [2, 0, 5], 'B': [2, None, -0.25]})
df2 = pd.DataFrame({'A': [3, 1, None], 'B': [3, 3, -4]})

DataFrame 의 내용을 확인하기 위해 출력해 보겠습니다.

print("DataFrame 1:")
print(df1)
print("\nDataFrame 2:")
print(df2)

출력:

DataFrame 1:
   A     B
0  2  2.00
1  0   NaN
2  5 -0.25

DataFrame 2:
     A  B
0  3.0  3
1  1.0  3
2  NaN -4

combine() 메서드를 사용하여 DataFrame 결합하기

이제 combine() 메서드를 사용하여 두 DataFrame 을 결합해 보겠습니다.

combined_df = df1.combine(df2, min)

min 함수는 두 열 사이에서 더 작은 값을 선택하기 위해 func 매개변수로 사용됩니다.

결과를 확인하기 위해 결합된 DataFrame 을 출력해 보겠습니다.

print("\nCombined DataFrame:")
print(combined_df)

출력:

Combined DataFrame:
     A     B
0  2.0  2.00
1  0.0   NaN
2  5.0 -4.00

사용자 정의 함수로 DataFrame 결합

DataFrame 을 결합하기 위해 func 매개변수로 사용자 정의 함수를 사용할 수도 있습니다. 각 열의 값을 곱하는 사용자 정의 함수 multiply_columns를 만들어 보겠습니다.

def multiply_columns(s1, s2):
    return s1 * s2

combined_df = df1.combine(df2, multiply_columns)

결과를 확인하기 위해 결합된 DataFrame 을 출력해 보겠습니다.

print("\nCombined DataFrame:")
print(combined_df)

출력:

Combined DataFrame:
     A    B
0  6.0  6.0
1  0.0  NaN
2  NaN  1.0

요약

이 랩에서는 pandas 의 combine() 메서드를 사용하여 두 DataFrame 을 열 방향으로 결합하는 방법을 배웠습니다. 내장 함수와 사용자 정의 함수를 사용하여 열을 병합하는 방법을 살펴보았습니다. combine() 메서드는 특정 조건이나 규칙에 따라 두 DataFrame 의 열을 병합하려는 경우 유용합니다. 데이터를 결합하는 방식에 유연성을 제공하며 필요한 경우 누락된 값을 채웁니다.