Pandas DataFrame 중복 제거 메서드

Beginner

소개

이 랩에서는 Pandas DataFrame 의 drop_duplicates() 메서드를 사용하여 중복된 행을 제거하는 방법을 배웁니다. 이 메서드를 예제와 함께 사용하는 데 필요한 단계를 안내합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위한 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리 가져오기

먼저, 필요한 라이브러리를 가져와야 합니다. 이 랩에서는 Pandas 라이브러리를 사용합니다.

import pandas as pd

DataFrame 생성

다음으로, 중복된 행을 포함하는 DataFrame 을 생성해야 합니다. pd.DataFrame() 함수를 사용하여 DataFrame 을 생성합니다.

df = pd.DataFrame({'Name': ['Navya', 'Vindya', 'Navya', 'Vindya', 'Sinchana', 'Sinchana'],
                   'Skills': ['Python', 'Java', 'Python', 'Java', 'Java', 'Java']})
print(df)

중복 행 제거

이제 drop_duplicates() 메서드를 사용하여 DataFrame 에서 중복 행을 제거할 수 있습니다. 이 메서드는 중복 행이 제거된 새로운 DataFrame 을 반환합니다.

df = df.drop_duplicates()
print("After removing duplicate rows:")
print(df)

요약

이 랩에서는 Pandas DataFrame 에서 drop_duplicates() 메서드를 사용하여 중복 행을 제거하는 방법을 배웠습니다. 고려할 열 또는 유지할 중복을 지정하여 메서드가 중복을 처리하는 방식을 사용자 정의할 수 있습니다.

이러한 단계를 따르면 drop_duplicates() 메서드를 사용하여 Pandas DataFrame 에서 중복 행을 효과적으로 제거할 수 있습니다.