Метод describe() для DataFrame в Pandas

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии вы научитесь использовать метод describe() библиотеки Pandas для генерации описательных статистик для DataFrame. Метод describe() вычисляет различные статистические показатели, такие как количество записей, среднее значение, стандартное отклонение, минимум, максимум и перцентили для числовых столбцов. Он также предоставляет обобщенные статистические данные для столбцов с типом данных объекта.

Советы по работе с ВМ

После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки и создаем DataFrame

Сначала импортируем библиотеку Pandas с помощью ключевого слова import. Создадим DataFrame с использованием метода pd.DataFrame() и примера данных.

import pandas as pd

## Create a DataFrame
df = pd.DataFrame([['Abhishek', 100, 'Science', 90],
                   ['Anurag', 101, 'Science', 85],
                   ['Chetan', 103, 'Maths', 75]],
                  columns=['Name', 'Roll No', 'Subject', 'Marks'])

Опишите DataFrame с использованием метода describe()

Для описания DataFrame используйте метод describe() для объекта DataFrame.

## Describe the DataFrame
description = df.describe()

## Print the description
print(description)

Опишите все столбцы DataFrame

Для описания всех столбцов DataFrame, включая как числовые, так и объектовые типы данных, используйте параметр include='all' в методе describe().

## Describe all columns of the DataFrame
description_all_columns = df.describe(include='all')

## Print the description of all columns
print(description_all_columns)

Опишите конкретный столбец DataFrame

Для описания конкретного столбца DataFrame, получите доступ к нему как к атрибуту и используйте метод describe().

## Describe a specific column of the DataFrame
marks_description = df.Marks.describe()

## Print the description of the 'Marks' column
print(marks_description)

Исключите числовые столбцы из описания

Для исключения числовых столбцов из описания используйте параметр exclude=np.number в методе describe().

import numpy as np

## Exclude numeric columns from the description
description_exclude_numeric = df.describe(exclude=np.number)

## Print the description excluding numeric columns
print(description_exclude_numeric)

Опишите DataFrame с значениями None

Для описания DataFrame, содержащего значения None, метод describe() будет обрабатывать их соответствующим образом.

## Create a DataFrame with None values
df_with_none = pd.DataFrame([['Abhishek', 101, 'Science', None],
                             ['Anurag', None, 'Science', 85],
                             ['Chetan', None, 'Maths', 75]],
                            columns=['Name', 'Roll No', 'Subject', 'Marks'])

## Describe the DataFrame with None values
description_with_none = df_with_none.describe()

## Print the description of the DataFrame with None values
print(description_with_none)

Резюме

Поздравляем! В этом практическом занятии вы узнали, как использовать метод describe() в Pandas для генерации описательных статистик для DataFrame. Вы можете использовать этот метод, чтобы получить ценные инсайты о центральном тенденции, дисперсии и форме распределения набора данных. Метод describe() - это мощный инструмент для анализа и исследования данных. Удачной работы!