Метод медианы в DataFrame Pandas

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии мы научимся использовать метод median() из библиотеки Pandas для вычисления медианы значений в DataFrame. Метод median() позволяет найти серединное значение в наборе данных, что дает представление о центральном тенденции.

Советы по работе с ВМ

После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем библиотеку pandas

Во - первых, нам нужно импортировать библиотеку 'pandas', которая обычно используется для манипуляций с данными и анализа.

import pandas as pd

Создаем DataFrame

Далее мы создадим объект DataFrame с использованием конструктора pd.DataFrame(). Это позволит нам хранить и манипулировать нашими данными.

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print("------The DataFrame is------")
print(df)

Вычисляем медиану по оси индекса

Для вычисления медианы по оси индекса DataFrame мы можем использовать метод median(), установив параметр axis равным 0.

print("---------------------------")
print(df.median(axis=0))

Вычисляем медиану по оси столбца

Для вычисления медианы по оси столбца DataFrame мы можем использовать метод median(), установив параметр axis равным 1.

print("---------------------------")
print(df.median(axis=1))

Обработка пустых значений

Если наш DataFrame содержит пустые значения, мы можем их обработать, указав параметр skipna. По умолчанию skipna установлен в True, что исключает пустые значения при вычислении медианы. Если мы хотим включить пустые значения, мы можем установить skipna в False.

df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
print("------The DataFrame is------")
print(df)
print("---------------------------")
print(df.median(axis=0, skipna=False))

Резюме

В этом практическом занятии мы узнали, как использовать метод median() в Pandas для вычисления медианы значений в DataFrame. Мы изучили, как вычислить медиану по оси индекса и оси столбца. Кроме того, мы узнали, как обрабатывать пустые значения при вычислении медианы. Вычисление медианы полезно для понимания центральной тенденции набора данных и может быть использовано для принятия информированных решений при анализе данных.