Pandas DataFrame 정렬 함수

Beginner

소개

이 랩에서는 Python Pandas 라이브러리의 DataFrame.align() 함수를 살펴보겠습니다. align() 함수를 사용하면 outer, inner, left, right 와 같은 다양한 join 방식을 사용하여 두 DataFrame 을 축 (axis) 에 맞춰 정렬할 수 있습니다. 이는 두 DataFrame 간 또는 DataFrame 과 Series 간에 데이터를 동기화하려는 경우에 유용합니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

필요한 라이브러리 import 및 DataFrame 생성

먼저 pandas 라이브러리를 가져와 서로 다른 인덱스와 열을 가진 두 개의 DataFrame 을 생성해 보겠습니다. 첫 번째 DataFrame 인 df1은 'Name', 'Roll No', 'Subject', 'Marks' 열을 가지며, 두 번째 DataFrame 인 df2는 'Name', 'Roll No', 'Marks' 열을 갖습니다.

import pandas as pd

df1 = pd.DataFrame([['Abhishek',100,'Science',90], ['Anurag',101,'Science',85]], columns=['Name', 'Roll No', 'Subject', 'Marks'], index=[1,2])
df2 = pd.DataFrame([['Chetan',103,75], ['Divya',104,80], ['Diya',105,92]], columns=['Name', 'Roll No', 'Marks'], index=[2,3,4])

'left' join 을 사용하여 열 (columns) 기준으로 DataFrame 정렬

다음으로, "left" join 을 사용하여 두 DataFrame 을 열에 맞춰 정렬해 보겠습니다. align() 함수를 사용하고 join 방식을 "left"로, 축 (axis) 을 1 로 지정합니다.

a1, a2 = df1.align(df2, join='left', axis=1)
print(a1)
print(a2)

'right' join 을 사용하여 열 (columns) 기준으로 DataFrame 정렬

마찬가지로, "right" join 을 사용하여 DataFrame 을 열에 맞춰 정렬할 수 있습니다. align() 함수를 사용하고 join 방식을 "right"로, 축 (axis) 을 1 로 지정합니다.

a1, a2 = df1.align(df2, join='right', axis=1)
print(a1)
print(a2)

'outer' join 을 사용하여 열 (columns) 기준으로 DataFrame 정렬

또한 "outer" join 을 사용하여 DataFrame 을 열에 맞춰 정렬할 수 있습니다. align() 함수를 사용하고 join 방식을 "outer"로, 축 (axis) 을 1 로 지정합니다.

a1, a2 = df1.align(df2, join='outer', axis=1)
print(a1)
print(a2)

'inner' join 을 사용하여 열 (columns) 기준으로 DataFrame 정렬

마지막으로, "inner" join 을 사용하여 DataFrame 을 열에 맞춰 정렬할 수 있습니다. align() 함수를 사용하고 join 방식을 "inner"로, 축 (axis) 을 1 로 지정합니다.

a1, a2 = df1.align(df2, join='inner', axis=1)
print(a1)
print(a2)

요약

이 랩에서는 Pandas 라이브러리에서 DataFrame.align() 함수를 사용하는 방법을 배웠습니다. outer, inner, left, right 와 같은 다양한 join 방식을 탐구하여 두 DataFrame 을 열 또는 인덱스에 맞춰 정렬했습니다. 이 함수는 서로 다른 데이터 소스 간에 데이터를 동기화하거나 정렬된 데이터에 대한 작업을 수행하려는 경우에 유용합니다.