Pandas DataFrame info() 메서드

Beginner

소개

Python Pandas 라이브러리의 info() 메서드는 DataFrame 의 요약을 얻는 데 사용됩니다. 이 메서드는 DataFrame 에 대한 귀중한 정보를 제공하며, 여기에는 인덱스 dtype 및 열, null 이 아닌 값, 메모리 사용량이 포함됩니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리 가져오기

먼저, Python 에서 강력한 데이터 조작 라이브러리인 pandas 라이브러리를 가져와야 합니다.

import pandas as pd

DataFrame 생성

다음으로, DataFrame 을 생성해야 합니다. pd.DataFrame() 함수를 사용하고 데이터 딕셔너리를 전달하여 이를 수행할 수 있습니다.

int_values = [1, 2, 3, 4, 5]
text_values = ['alpha', 'beta', 'gamma', 'delta', 'epsilon']
float_values = [0.0, 0.25, 0.5, 0.75, 1.0]
df = pd.DataFrame({"int_col": int_values, "text_col": text_values, "float_col": float_values})

info() 메서드 사용

이제 DataFrame 이 있으므로 info() 메서드를 사용하여 요약 정보를 얻을 수 있습니다. 기본적으로 info() 메서드는 DataFrame 의 전체 요약을 출력합니다.

df.info()

출력 결과 분석

코드를 실행하면 각 열의 데이터 유형, null 이 아닌 값의 수, 메모리 사용량을 포함하여 DataFrame 에 대한 요약 정보를 볼 수 있습니다. 다음은 예시 출력입니다.

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5 entries, 0 to 4
Data columns (total 3 columns):
 ##   Column    Non-Null Count  Dtype
---  ------    --------------  -----
 0   int_col   5 non-null      int64
 1   text_col  5 non-null      object
 2   float_col 5 non-null      float64
dtypes: float64(1), int64(1), object(1)
memory usage: 248.0+ bytes

요약

Python Pandas 라이브러리의 info() 메서드는 DataFrame 의 간략한 요약을 얻는 데 유용한 메서드입니다. 인덱스 dtype 및 열, null 이 아닌 값, 메모리 사용량에 대한 정보를 제공합니다. 기본적으로 전체 요약을 표시하지만, 매개변수를 수정하여 출력을 사용자 정의할 수도 있습니다. 이 메서드는 특히 대규모 데이터 세트를 처리할 때 DataFrame 의 구조를 이해하는 데 도움이 됩니다. info()에서 얻은 정보를 통해 데이터 정리, 조작 및 분석에 대한 정보에 입각한 결정을 내릴 수 있습니다.