Pandas DataFrame のピボットテーブルをマスターする

はじめに

この実験では、Python の pandas ライブラリのpivot_table()メソッドについて学びます。pivot_table()メソッドは、DataFrame 内のデータを集計して要約するために使用されます。新しい DataFrame としてスプレッドシート形式のピボットテーブルを返します。

VM のヒント

VM の起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebook を使って練習しましょう。

時々、Jupyter Notebook が読み込み終わるまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。

学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。

必要なライブラリをインポートして DataFrame を作成する

まず、pandas ライブラリをインポートして、サンプルデータを使って DataFrame を作成しましょう。'Date'、'State'、'Temperature'、'Humidity'の列を持つ DataFrame を作成します。

import pandas as pd

df = pd.DataFrame({'Date': ['1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021', '1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021'],
                   'State': ['Karnataka', 'Karnataka', 'Karnataka', 'Karnataka', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu'],
                   'Temperature': [25, 29, 28, 31, 26, 27, 22, 32],
                   'Humidity': [46, 50, 52, 59, 42, 45, 46, 43]})

pivot_table() メソッドを使って DataFrame を集計する

DataFrame 内のデータをpivot_table()メソッドを使って集計するには、インデックスとして使用する列、列、および集計する値を指定する必要があります。

pivot_df = df.pivot_table(index='Date', columns='State', aggfunc='mean')

結果の DataFrame を表示する

最後に、結果のピボットテーブル DataFrame を表示しましょう。

print(pivot_df)

まとめ

これらの手順に従うことで、pandas ライブラリのpivot_table()メソッドを使って DataFrame 内のデータを集計して要約することができました。このメソッドは、表形式でデータを分析し視覚化する際に便利です。結果のピボットテーブル DataFrame は、異なるインデックスと列に基づいた集計値を見るための便利な方法を提供します。

Pandas DataFrame のピボットテーブルメソッド

はじめに

VM のヒント

必要なライブラリをインポートして DataFrame を作成する

pivot_table() メソッドを使って DataFrame を集計する

結果の DataFrame を表示する

まとめ