Pandas DataFrame 平均値メソッドの習得

はじめに

この実験では、Pandas ライブラリの mean() メソッドを使用して DataFrame の平均値を計算する方法を学びます。mean() メソッドは、DataFrame のインデックスまたは列軸に沿って平均値を計算するために使用できます。

VM のヒント

VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使用して練習します。

場合によっては、Jupyter Notebook が読み込み完了するまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。

学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。

必要なライブラリをインポートする

まず、次のコードを使用して必要なライブラリである Pandas と NumPy をインポートしましょう。

import pandas as pd
import numpy as np

DataFrame を作成する

次に、次のコードを使用して DataFrame を作成しましょう。

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})

インデックス軸に沿った平均値を計算する

DataFrame のインデックス軸に沿った平均値を計算するには、axis=0 パラメータを持つ mean() メソッドを使用できます。以下は例です。

mean_index = df.mean(axis=0)
print(mean_index)

列軸に沿った平均値を計算する

DataFrame の列軸に沿った平均値を計算するには、axis=1 パラメータを持つ mean() メソッドを使用できます。以下は例です。

mean_column = df.mean(axis=1)
print(mean_column)

欠損値を処理する

既定では、mean() メソッドは平均値を計算する際に欠損値を除外します。ただし、skipna パラメータを False に設定することでこの動作を変更できます。以下は欠損値を含むインデックス軸に沿った平均値を計算する例です。

df_with_null = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
mean_null = df_with_null.mean(axis=0, skipna=False)
print(mean_null)

概要

この実験では、Pandas ライブラリの mean() メソッドを使用して DataFrame の平均値を計算する方法を学びました。インデックス軸と列軸に沿った平均値の計算方法、および平均値を計算する際の欠損値の処理方法を見てきました。mean() メソッドは、Pandas DataFrame のデータを分析および要約するための便利なツールです。

結論

Pandas ライブラリの mean() メソッドは、DataFrame の平均値を計算するための強力なツールです。異なる軸に沿った平均値の計算に柔軟性を提供し、欠損値を適切に処理します。mean() メソッドの使い方を理解することは、Pandas によるデータ分析に不可欠なスキルです。

まとめ

おめでとうございます！あなたは Pandas DataFrame の平均値メソッドの実験を完了しました。あなたのスキルを向上させるために、LabEx でさらに実験を行って練習することができます。