はじめに
この実験では、Pandas ライブラリの corrwith() メソッドを使用して 2 つの DataFrame 間のペアワイズ相関を計算する方法を学びます。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使用して練習します。
場合によっては、Jupyter Notebook が読み込み完了するまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証は自動化できません。
学習中に問題が発生した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。
必要なライブラリをインポートする
corrwith() メソッドを使用するには、pandas ライブラリをインポートする必要があります。
import pandas as pd
DataFrame を作成する
この実験で使用する 2 つの DataFrame を作成しましょう。
chart_1 = {'Name':['Chetan','yashas','yuvraj'],'Age': [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df1 = pd.DataFrame(chart_1)
chart_2 = {'Name':['Pooja','Sindu','Renuka'],'Age': [18,25,20],'Height': [145,155,165],'Weight': [45,55,65]}
df2 = pd.DataFrame(chart_2)
corrwith() メソッドを使って相関を計算する
2 つの DataFrame 間の相関を計算するには、corrwith() メソッドを使用できます。
df1.corrwith(df2)
相関方法を指定する
デフォルトでは、corrwith() メソッドはピアソン相関係数を使用します。ただし、method パラメータを使用して相関方法を指定することができます。
df1.corrwith(df2, method='kendall')
まとめ
この実験では、Pandas ライブラリの corrwith() メソッドを使用して 2 つの DataFrame 間のペアワイズ相関を計算する方法を学びました。このメソッドは、2 つのデータセットの異なる列間の相関を見つけるのに役立ちます。相関方法を指定することで、ピアソン、ケンダル、またはスピアマンの相関係数を計算できます。これにより、変数間の関係を理解し、データに基づいた意思決定を行うことができます。