Метод cummax() для DataFrame в Pandas

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии мы научимся использовать метод cummax() из библиотеки pandas. Метод cummax() используется для вычисления накопленной максимальной величины вдоль оси DataFrame или Series. Возвращает DataFrame или Series того же размера, содержащие накопленные максимальные значения.

Советы по работе с ВМ

После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем библиотеку pandas

Для использования метода cummax() необходимо сначала импортировать библиотеку pandas. Это можно сделать, выполнив следующий код:

import pandas as pd

Создаем DataFrame

Далее необходимо создать DataFrame, на котором можно применить метод cummax(). Создадим DataFrame с использованием функции pd.DataFrame() и передав в нее словарь. Каждый ключ в словаре представляет имя столбца, а соответствующее значение — список, содержащий данные столбца.

df = pd.DataFrame({"A":[1, 2, 8, 4], "B":[9, 10, 7, 8], "C":[9, 10, 11, 12], "D":[13, 16, 15, 16]})

Применяем метод cummax()

Теперь можно применить метод cummax() к нашему DataFrame. Метод cummax() имеет три необязательных параметра: axis, skipna и дополнительные args/kwargs.

Параметр axis используется для указания оси, вдоль которой должно вычисляться накопленное максимальное значение. По умолчанию он равен 0 или 'index', что означает, что накопленное максимальное значение будет вычисляться по оси индексов. Если установлено в 1 или 'columns', накопленное максимальное значение будет вычисляться по оси столбцов.

Параметр skipna — это логическое значение, определяющее, следует ли исключать значения NA/null из вычислений. Если установлено в True, значения NA/null будут исключены. Если установлено в False, значения NA/null будут включены.

Для применения метода cummax() можно использовать следующий код:

df_cummax = df.cummax(axis=0, skipna=True)

Выводим результат

Наконец, можно вывести результат метода cummax() для просмотра накопленных максимальных значений.

print(df_cummax)

Резюме

В этом практическом занятии мы узнали, как использовать метод cummax() в библиотеке pandas для вычисления накопленного максимального значения по оси DataFrame или Series. Мы увидели, как импортировать библиотеку pandas, создать DataFrame, применить метод cummax() с необязательными параметрами и вывести результат. Метод cummax() полезен для анализа тенденций и поиска максимальных значений в наборе данных в течение времени. Это может быть ценный инструмент в процессах анализа данных и принятия решений.