Pandas DataFrame のカウントメソッド

Beginner

はじめに

この実験では、Pandas DataFrame クラスの count() メソッドについて学びます。count() メソッドは、DataFrame 内の null でない値の数を各列または各行に対してカウントするために使用されます。

VM のヒント

VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使って練習しましょう。

Jupyter Notebook の読み込みには数秒かかる場合があります。Jupyter Notebook の制限により、操作の検証は自動化できません。

学習中に問題が発生した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。

必要なライブラリをインポートする

まず、この実験に必要なライブラリをインポートしましょう。

import pandas as pd
import numpy as np

DataFrame を作成する

次に、この実験の例で使用する DataFrame を作成しましょう。私たちの DataFrame には、学生の名前、学籍番号、科目、成績などの情報が含まれます。

df = pd.DataFrame([
    ['Abhishek', '101', 'Science', 90],
    ['Anurag', '102', None, 85]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

各列の null でない値をカウントする

DataFrame の各列の null でない値の数をカウントするには、パラメータなしで count() メソッドを使用できます。これにより、インデックスが列名を表し、値が各列の null でない値のカウントを表す Series オブジェクトが返されます。

column_counts = df.count()
print(column_counts)

出力:

Name       2
Roll No    2
Subject    1
Marks      2
dtype: int64

各行の null でない値をカウントする

DataFrame の各行の null でない値の数をカウントするには、axis パラメータを 1 に設定して count() メソッドを使用できます。これにより、インデックスが行番号を表し、値が各行の null でない値のカウントを表す Series オブジェクトが返されます。

row_counts = df.count(axis=1)
print(row_counts)

出力:

0    4
1    3
dtype: int64

各行の数値型の null でない値をカウントする

各行の数値型の null でない値のみをカウントしたい場合は、numeric_only パラメータを True に設定して count() メソッドを使用できます。これにより、数値型のデータ型(float、int)の列のみがカウントされ、非数値型のデータ型(object)の列は除外されます。

numeric_counts = df.count(numeric_only=True)
print(numeric_counts)

出力:

Roll No    2
Marks      2
dtype: int64

まとめ

おめでとうございます!あなたは Pandas DataFrame の count() メソッドに関するこの実験を成功裏に完了しました。この実験では、count() メソッドを使用して、DataFrame の各列または各行の null でない値の数をカウントする方法を学びました。また、numeric_only パラメータを使用して、数値型の null でない値のみをカウントする方法も学びました。練習を続け、Pandas ライブラリのさまざまなメソッドを探求して、Python を使ったデータ分析と操作に精通するようにしましょう。楽しいコーディングを!