Pandas DataFrame のピボットテーブルメソッド

PythonPythonBeginner
今すぐ練習

💡 このチュートリアルは英語版からAIによって翻訳されています。原文を確認するには、 ここをクリックしてください

はじめに

この実験では、Pythonのpandasライブラリのpivot_table()メソッドについて学びます。pivot_table()メソッドは、DataFrame内のデータを集計して要約するために使用されます。新しいDataFrameとしてスプレッドシート形式のピボットテーブルを返します。

VMのヒント

VMの起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebookを使って練習しましょう。

時々、Jupyter Notebookが読み込み終わるまで数秒待つ必要がある場合があります。Jupyter Notebookの制限により、操作の検証を自動化することはできません。

学習中に問題に遭遇した場合は、Labbyにお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") pandas/DataAnalysisGroup -.-> pandas/data_aggregation("Data Aggregation") pandas/DataAnalysisGroup -.-> pandas/pivot_tables("Pivot Tables") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/read_csv -.-> lab-68694{{"Pandas DataFrame のピボットテーブルメソッド"}} python/importing_modules -.-> lab-68694{{"Pandas DataFrame のピボットテーブルメソッド"}} pandas/data_aggregation -.-> lab-68694{{"Pandas DataFrame のピボットテーブルメソッド"}} pandas/pivot_tables -.-> lab-68694{{"Pandas DataFrame のピボットテーブルメソッド"}} python/data_collections -.-> lab-68694{{"Pandas DataFrame のピボットテーブルメソッド"}} python/data_analysis -.-> lab-68694{{"Pandas DataFrame のピボットテーブルメソッド"}} end

必要なライブラリをインポートしてDataFrameを作成する

まず、pandasライブラリをインポートして、サンプルデータを使ってDataFrameを作成しましょう。'Date'、'State'、'Temperature'、'Humidity'の列を持つDataFrameを作成します。

import pandas as pd

df = pd.DataFrame({'Date': ['1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021', '1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021'],
                   'State': ['Karnataka', 'Karnataka', 'Karnataka', 'Karnataka', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu'],
                   'Temperature': [25, 29, 28, 31, 26, 27, 22, 32],
                   'Humidity': [46, 50, 52, 59, 42, 45, 46, 43]})

pivot_table()メソッドを使ってDataFrameを集計する

DataFrame内のデータをpivot_table()メソッドを使って集計するには、インデックスとして使用する列、列、および集計する値を指定する必要があります。

pivot_df = df.pivot_table(index='Date', columns='State', aggfunc='mean')

結果のDataFrameを表示する

最後に、結果のピボットテーブルDataFrameを表示しましょう。

print(pivot_df)

まとめ

これらの手順に従うことで、pandasライブラリのpivot_table()メソッドを使ってDataFrame内のデータを集計して要約することができました。このメソッドは、表形式でデータを分析し視覚化する際に便利です。結果のピボットテーブルDataFrameは、異なるインデックスと列に基づいた集計値を見るための便利な方法を提供します。