Pandas DataFrame count() 메서드

Beginner

소개

이 랩에서는 Pandas DataFrame 클래스의 count() 메서드에 대해 배우겠습니다. count() 메서드는 DataFrame 에서 각 열 또는 각 행에 대해 null 이 아닌 값의 수를 계산하는 데 사용됩니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

필요한 라이브러리 임포트

먼저, 이 랩에 필요한 라이브러리를 가져오겠습니다.

import pandas as pd
import numpy as np

DataFrame 생성

다음으로, 이 랩의 예제에 사용할 DataFrame 을 생성해 보겠습니다. 우리의 DataFrame 은 학생들의 이름, 롤 번호, 과목 및 점수와 같은 정보를 포함합니다.

df = pd.DataFrame([
    ['Abhishek', '101', 'Science', 90],
    ['Anurag', '102', None, 85]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

각 열의 Null 아닌 값 개수 계산

DataFrame 의 각 열에 대한 non-null 값의 개수를 세려면, 매개변수 없이 count() 메서드를 사용할 수 있습니다. 이렇게 하면 인덱스가 열 이름을 나타내고 값이 각 열의 non-null 값 개수를 나타내는 Series 객체가 반환됩니다.

column_counts = df.count()
print(column_counts)

Output:

Name       2
Roll No    2
Subject    1
Marks      2
dtype: int64

각 행의 Null 아닌 값 개수 계산

DataFrame 의 각 행에 대한 non-null 값의 개수를 세려면, axis 매개변수를 1 로 설정하여 count() 메서드를 사용할 수 있습니다. 이렇게 하면 인덱스가 행 번호를 나타내고 값이 각 행의 non-null 값 개수를 나타내는 Series 객체가 반환됩니다.

row_counts = df.count(axis=1)
print(row_counts)

Output:

0    4
1    3
dtype: int64

각 행의 숫자형 Null 아닌 값 개수 계산

각 행에 대한 숫자 non-null 값만 세고 싶다면, numeric_only 매개변수를 True 로 설정하여 count() 메서드를 사용할 수 있습니다. 이렇게 하면 숫자 데이터 타입 (float, int) 을 가진 열만 계산하고, 숫자 외 데이터 타입 (object) 을 가진 열은 제외합니다.

numeric_counts = df.count(numeric_only=True)
print(numeric_counts)

Output:

Roll No    2
Marks      2
dtype: int64

요약

축하합니다! Pandas DataFrame 의 count() 메서드에 대한 이 랩을 성공적으로 완료했습니다. 이 랩에서는 count() 메서드를 사용하여 DataFrame 의 각 열 또는 행에 있는 non-null 값의 개수를 세는 방법을 배웠습니다. 또한 numeric_only 매개변수를 사용하여 숫자 non-null 값만 세는 방법도 배웠습니다. Python 을 사용하여 데이터 분석 및 조작에 능숙해지려면 Pandas 라이브러리의 다양한 메서드를 계속 연습하고 탐구하십시오. 즐거운 코딩 되세요!