Метод mode() в DataFrame библиотеки Pandas

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии вы узнаете, как использовать метод mode() в Pandas DataFrame. Метод mode() используется для поиска наиболее часто встречающихся значений в DataFrame.

Советы по использованию ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки

Сначала импортируем библиотеку Pandas с помощью инструкции import:

import pandas as pd

Создаем DataFrame

Теперь создадим DataFrame с помощью конструктора DataFrame(). Для примера создадим DataFrame с тремя столбцами: "A", "B" и "C".

df = pd.DataFrame({"A": [1, 2, 1], "B": [2, 2, 1], "C": [5, 2, 5]})

Найдем наиболее часто встречающиеся значения (моду)

Для нахождения наиболее часто встречающихся значений (моды) каждого столбца в DataFrame используйте метод mode():

df_mode = df.mode()
print(df_mode)

Метод mode() возвращает DataFrame, содержащий наиболее часто встречающиеся значения (моду) каждого столбца.

Укажите ось

По умолчанию метод mode() находит наиболее часто встречающиеся значения (моду) вдоль оси столбцов (axis=0). Если вы хотите найти наиболее часто встречающиеся значения (моду) вдоль оси строк, укажите axis=1.

Например, чтобы найти наиболее часто встречающиеся значения (моду) вдоль оси строк, используйте следующий код:

df_mode = df.mode(axis=1)
print(df_mode)

Включать только числовые столбцы

Если вы хотите включать в расчет моды только числовые столбцы, вы можете использовать параметр numeric_only. По умолчанию numeric_only установлен в False. Установите его в True, чтобы включить только числовые столбцы.

Например, чтобы включить в расчет моды только числовые столбцы, используйте следующий код:

df_mode = df.mode(numeric_only=True)
print(df_mode)

Включать значения NULL

По умолчанию метод mode() не учитывает значения NULL. Если вы хотите включить значения NULL в расчет моды, вы можете использовать параметр dropna. По умолчанию dropna установлен в True. Установите его в False, чтобы включить значения NULL.

Например, чтобы включить значения NULL в расчет моды, используйте следующий код:

df_mode = df.mode(dropna=False)
print(df_mode)

Резюме

В этом практическом занятии вы узнали, как использовать метод mode() в DataFrame библиотеки Pandas для нахождения наиболее часто встречающихся значений. Также вы узнали, как указать ось, включать только числовые столбцы и включать значения NULL. Теперь вы можете использовать эти знания для нахождения наиболее часто встречающихся значений в своих собственных проектах анализа данных.