Pandas の DataFrame.diff() メソッド

Beginner

はじめに

Pandas の DataFrame.diff() メソッドは、DataFrame 内の要素間の差分を計算します。このメソッドは要素の最初の離散差分を提供し、DataFrame 内のある要素と別の要素との差分を計算します。デフォルトでは、このメソッドは行内の前の要素との差分を計算します。

VM のヒント

VM の起動が完了したら、左上隅をクリックして Notebook タブに切り替え、Jupyter Notebook を開いて練習を行ってください。

場合によっては、Jupyter Notebook の読み込みが完了するまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。

学習中に問題が発生した場合は、Labby に質問してください。セッション終了後にフィードバックを提供していただければ、迅速に問題を解決します。

必要なライブラリをインポートする

DataFrame.diff() メソッドを使用するには、まず pandas ライブラリをインポートする必要があります。

import pandas as pd

DataFrame を作成する

次に、サンプルで使用する DataFrame を作成しましょう。

df = pd.DataFrame({'a': [1, 3, 8],'b': [3, 5, 8],'c': [16, 25, 36]})

この DataFrame には 3 つの列('a'、'b'、'c')と 3 つの行があります。

前の行との差分を計算する

前の行との差分を計算するには、DataFrame で diff() メソッドを呼び出すだけです。

diff_previous_row = df.diff()

これにより、各行の各要素と前の要素との差分が計算されます。

前の列との差分を計算する

前の行ではなく、前の列との差分を計算したい場合は、axis パラメータを 1 に指定することができます。

diff_previous_column = df.diff(axis=1)

これにより、各列の各要素と前の要素との差分が計算されます。

特定の前の行との差分を計算する

periods パラメータを指定することで、特定の前の行との差分を計算することもできます。たとえば、2 つ前の行との差分を計算するには、periods を 2 に設定します。

diff_second_previous_row = df.diff(periods=2)

これにより、各要素と 2 行前の要素との差分が計算されます。

特定の前の列との差分を計算する

同様に、periodsaxis パラメータを指定することで、特定の前の列との差分を計算することができます。たとえば、3 つ前の列との差分を計算するには、periods を 3、axis を 1 に設定します。

diff_third_previous_column = df.diff(periods=3, axis=1)

これにより、各要素と 3 列前の要素との差分が計算されます。

まとめ

Pandas の DataFrame.diff() メソッドを使用すると、DataFrame 内の要素間の差分を計算することができます。前の行や前の列との差分、または特定の前の行や列との差分を計算することができます。このメソッドは、時系列データの分析や、連続する行または列間の値の比較を行う際に便利です。diff() メソッドを使用することで、DataFrame 内の変化や差分を簡単に計算することができます。