Pandas DataFrame convert_dtypes 메서드

Beginner

소개

Python Pandas 의 DataFrame.convert_dtypes() 메서드는 DataFrame 의 열을 가능한 최상의 데이터 유형으로 변환하는 데 사용됩니다. 혼합된 데이터 유형을 포함하는 DataFrame 열을 처리하거나, 가장 적합한 데이터 유형으로 데이터를 저장하여 메모리 사용량을 최적화하려는 경우 특히 유용합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리를 가져오고 DataFrame 생성

먼저, DataFrame 클래스와 convert_dtypes() 메서드를 제공하는 pandas 라이브러리를 가져와야 합니다. 그런 다음, 서로 다른 데이터 유형의 열을 가진 DataFrame 을 생성할 수 있습니다.

import pandas as pd

df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': ['d', 'e', 'f'], 'C': [1, 2, 3], 'D': [True, False, True]})

DataFrame 의 현재 데이터 유형 확인

DataFrame 열의 현재 데이터 유형을 확인하기 위해 dtypes 속성을 사용할 수 있습니다.

print("Current data types:")
print(df.dtypes)

DataFrame 열을 최적의 데이터 유형으로 변환

DataFrame 열을 최적의 데이터 유형으로 변환하려면 convert_dtypes() 메서드를 사용할 수 있습니다. 기본적으로, 이 메서드는 object 데이터 유형을 가장 적합한 유형으로 변환하려고 시도합니다. 예를 들어, 문자열을 포함하는 object 열에는 StringDtype을, 부울 값을 포함하는 object 열에는 BooleanDtype을 사용합니다.

df_converted = df.convert_dtypes()

변환 후 데이터 유형 확인

이제 변환 후 DataFrame 열의 데이터 유형을 확인할 수 있습니다.

print("Data types after conversion:")
print(df_converted.dtypes)

요약

이 랩에서는 Python Pandas 에서 DataFrame.convert_dtypes() 메서드를 사용하여 DataFrame 의 열을 최적의 데이터 유형으로 변환하는 방법을 배웠습니다. 이 메서드는 열에 혼합된 데이터 유형이 있거나 메모리 사용량을 최적화할 때 유용합니다. 열을 가장 적합한 데이터 유형으로 변환함으로써 데이터 분석 및 조작 효율성을 향상시킬 수 있습니다.