Введение
В этом практическом занятии мы научимся использовать метод median() из библиотеки Pandas для вычисления медианы значений в DataFrame. Метод median() позволяет найти серединное значение в наборе данных, что дает представление о центральном тенденции.
Советы по работе с ВМ
После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортировать библиотеку pandas
Во - первых, нам нужно импортировать библиотеку 'pandas', которая обычно используется для манипуляций с данными и анализа.
import pandas as pd
Создать DataFrame
Далее мы создадим объект DataFrame с использованием конструктора pd.DataFrame(). Это позволит нам хранить и манипулировать нашими данными.
df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print("------The DataFrame is------")
print(df)
Вычислить медиану по оси индекса
Для вычисления медианы по оси индекса DataFrame мы можем использовать метод median(), установив параметр axis равным 0.
print("---------------------------")
print(df.median(axis=0))
Вычислить медиану по оси столбца
Для вычисления медианы по оси столбца DataFrame мы можем использовать метод median(), установив параметр axis равным 1.
print("---------------------------")
print(df.median(axis=1))
Работа с пустыми значениями
Если наш DataFrame содержит пустые значения, мы можем их обработать, указав параметр skipna. По умолчанию skipna установлен в True, что исключает пустые значения при вычислении медианы. Если мы хотим включить пустые значения, мы можем установить skipna в False.
df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
print("------The DataFrame is------")
print(df)
print("---------------------------")
print(df.median(axis=0, skipna=False))
Резюме
В этом практическом занятии мы узнали, как использовать метод median() в Pandas для вычисления медианы значений в DataFrame. Мы изучили, как вычислить медиану по оси индекса и оси столбца. Кроме того, мы узнали, как обрабатывать пустые значения при вычислении медианы. Вычисление медианы полезно для понимания центральной тенденции набора данных и может быть использовано для принятия информированных решений при анализе данных.