소개
이 랩에서는 Pandas DataFrame 의 combine_first() 메서드를 사용하는 방법을 배우겠습니다. 이 메서드를 사용하면 한 DataFrame 의 null 값을 다른 DataFrame 의 null 이 아닌 값으로 채워 두 DataFrame 객체를 결합할 수 있습니다. 한 DataFrame 에 누락된 데이터가 있고 이를 다른 DataFrame 의 데이터로 채우고 싶을 때 유용합니다.
VM 팁
VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.
때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.
학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.
필요한 라이브러리 가져오기
import pandas as pd
결측값이 있는 두 개의 DataFrame 생성
df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [1, 1], 'B': [3, 3]})
combine_first() 메서드를 사용하여 DataFrame 결합
combined_df = df1.combine_first(df2)
결합된 DataFrame 출력
print(combined_df)
DataFrame 중 하나에 새로운 행 추가
df2.loc[2] = [2, 2]
DataFrames 다시 결합
combined_df = df1.combine_first(df2)
결합된 DataFrame 다시 출력
print(combined_df)
None 값을 포함한 DataFrame 결합
df1 = pd.DataFrame({'A': [None, 0], 'B': [None, 4]})
df2 = pd.DataFrame({'A': [None, 1], 'B': [None, 3]})
combined_df = df1.combine_first(df2)
print(combined_df)
서로 다른 인덱스를 가진 DataFrame 결합
df1 = pd.DataFrame({'A': [None, 0], 'B': [4, None]})
df2 = pd.DataFrame({'B': [3, 3], 'C': [1, 1]}, index=[1, 2])
combined_df = df1.combine_first(df2)
print(combined_df)
요약
이 랩에서는 Pandas DataFrame 의 combine_first() 메서드를 사용하는 방법을 배웠습니다. 이 메서드를 사용하면 한 DataFrame 의 null 값을 다른 DataFrame 의 non-null 값으로 채울 수 있다는 것을 확인했습니다. 또한 두 DataFrame 모두 null 값을 갖거나 DataFrame 이 서로 다른 인덱스를 갖는 경우를 처리하는 방법도 살펴보았습니다. combine_first() 메서드는 DataFrame 에서 누락된 데이터를 결합하고 채우는 데 유용한 도구입니다.