Введение
В этом практическом занятии вы научитесь использовать метод agg() из библиотеки pandas для агрегирования данных в DataFrame. Этот метод позволяет выполнять одну или несколько операций по указанной оси, такой как строки или столбцы, и возвращает скаляр, Series или DataFrame в зависимости от выбранной функции.
Советы по работе с ВМ
После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортировать библиотеку pandas
Сначала вам нужно импортировать библиотеку pandas с помощью инструкции import:
import pandas as pd
Создать DataFrame
Далее создайте объект DataFrame для работы. Вы можете использовать функцию pd.DataFrame() для создания DataFrame из списка или массива. Вот пример:
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=['A', 'B', 'C'])
Агрегирование DataFrame с использованием одной функции по строкам
Для агрегирования DataFrame с использованием одной функции вы можете использовать метод agg(). Укажите функцию, которую хотите применить к строкам, используя имя функции в виде строки или объект функции. Вот пример:
print("Printing the sum of values in DataFrame")
print(df.agg(["sum"]))
Агрегирование DataFrame с использованием одной функции по столбцам
Для агрегирования DataFrame с использованием одной функции по столбцам установите параметр axis равным 'columns'. Это применит функцию к каждому столбцу вместо каждой строки. Вот пример:
print("Printing the minimum value in DataFrame")
print(df.agg(["min"], axis='columns'))
Агрегирование DataFrame с использованием списка функций по строкам и столбцам
Вы также можете агрегировать DataFrame с использованием списка функций. Это позволяет выполнять несколько операций по строкам или столбцам. Вот пример:
print("Printing sum and min of the DataFrame with default axis")
print(df.agg(["sum", "min"]))
Агрегирование DataFrame с различными функциями по столбцам
Для большей гибкости вы можете передать словарь с именами столбцов и соответствующими функциями в метод agg(). Это позволяет применить разные функции к разным столбцам. Вот пример:
print("Printing different aggregation functions over the columns")
print(df.agg({'A': ["sum"], 'B': ["min", "max"], 'C': ["count"]}))
Резюме
В этом практическом занятии вы узнали, как использовать метод agg() в pandas для агрегирования данных в DataFrame. Теперь вы знаете, как применять одиночные и множественные функции по строкам и столбцам DataFrame. Этот метод полезен для выполнения различных операций агрегирования над вашими данными. Пробуйте разные функции и оси, чтобы проанализировать и подвести итоги по своему DataFrame. Удачного анализа!