Метод expanding() для DataFrame в Pandas

Beginner

Введение

В этом лабораторном занятии мы исследуем метод expanding() для DataFrame в Pandas. Этот метод является частью оконных функций в Pandas и используется для расширяющих преобразований. Он возвращает объект окна для указанной операции.

Советы по работе с ВМ

После завершения запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортировать необходимые библиотеки

Во - первых, нам нужно импортировать необходимые библиотеки, а именно Pandas. Мы будем использовать псевдоним pd для обращения к библиотеке Pandas.

import pandas as pd

Создать DataFrame

Далее мы создадим DataFrame для работы. В этом примере мы будем использовать DataFrame с колонками 'A' и 'B'.

df = pd.DataFrame({"A": [1, 2, 3], "B": [1, 1, 1]})

Применить метод expanding для вычисления накопительной суммы

Теперь применим метод expanding() для вычисления накопительной суммы всего DataFrame.

df_expanding_sum = df.expanding().sum()
print(df_expanding_sum)

Сохранить результат в новой колонке

Мы также можем сохранить результат расчета expanding в новую колонку DataFrame. В этом примере мы сохраним накопительную сумму колонки 'A' в новую колонку'result'.

df['result'] = df['A'].expanding().sum()
print(df)

Вычислить накопительную сумму по оси строк

Более того, мы можем вычислить накопительную сумму всего DataFrame по оси строк.

df_expanding_sum_row = df.T.expanding().sum().T
print(df_expanding_sum_row)

Указать минимальное количество требуемых наблюдений

Мы также можем указать минимальное количество наблюдений, необходимых для того, чтобы расчет expanding имел значение. Это можно сделать с использованием параметра min_periods. В этом примере мы установим min_periods=2.

df_expanding_sum_min = df.expanding(min_periods=2).sum()
print(df_expanding_sum_min)

Резюме

В этом практическом занятии мы изучили метод expanding() в DataFrame библиотеки Pandas. Мы применили этот метод для вычисления накопительной суммы DataFrame, сохранения результата в новую колонку, вычисления накопительной суммы по оси строк и указания минимального количества наблюдений для расчета expanding. Метод expanding() полезен для исследования накопительной суммы данных в течение времени.