Método describe() de DataFrame de Pandas

Beginner

Introducción

En este laboratorio, aprenderá a usar el método describe() de la biblioteca Pandas para generar estadísticas descriptivas para un DataFrame. El método describe() calcula varias medidas estadísticas, como la cuenta, la media, la desviación estándar, el mínimo, el máximo y los percentiles para las columnas numéricas. También proporciona estadísticas resumidas para las columnas con tipos de datos de objeto.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar las bibliotecas necesarias y crear un DataFrame

Primero, importe la biblioteca Pandas usando la palabra clave import. Cree un DataFrame usando el método pd.DataFrame() con datos de muestra.

import pandas as pd

## Create a DataFrame
df = pd.DataFrame([['Abhishek', 100, 'Science', 90],
                   ['Anurag', 101, 'Science', 85],
                   ['Chetan', 103, 'Maths', 75]],
                  columns=['Name', 'Roll No', 'Subject', 'Marks'])

Describir el DataFrame usando el método describe()

Para describir el DataFrame, use el método describe() en el objeto DataFrame.

## Describe the DataFrame
description = df.describe()

## Print the description
print(description)

Describe todas las columnas del DataFrame

Para describir todas las columnas del DataFrame, incluyendo tanto los tipos de datos numéricos como de objeto, use el parámetro include='all' en el método describe().

## Describe all columns of the DataFrame
description_all_columns = df.describe(include='all')

## Print the description of all columns
print(description_all_columns)

Describe una columna específica del DataFrame

Para describir una columna específica del DataFrame, accédele como un atributo y use el método describe().

## Describe a specific column of the DataFrame
marks_description = df.Marks.describe()

## Print the description of the 'Marks' column
print(marks_description)

Excluir columnas numéricas de la descripción

Para excluir columnas numéricas de la descripción, use el parámetro exclude=np.number en el método describe().

import numpy as np

## Exclude numeric columns from the description
description_exclude_numeric = df.describe(exclude=np.number)

## Print the description excluding numeric columns
print(description_exclude_numeric)

Describe un DataFrame con valores None

Para describir un DataFrame que contiene valores None, el método describe() los manejará adecuadamente.

## Create a DataFrame with None values
df_with_none = pd.DataFrame([['Abhishek', 101, 'Science', None],
                             ['Anurag', None, 'Science', 85],
                             ['Chetan', None, 'Maths', 75]],
                            columns=['Name', 'Roll No', 'Subject', 'Marks'])

## Describe the DataFrame with None values
description_with_none = df_with_none.describe()

## Print the description of the DataFrame with None values
print(description_with_none)

Resumen

¡Felicidades! En este laboratorio, aprendiste cómo usar el método describe() en Pandas para generar estadísticas descriptivas para un DataFrame. Puedes usar este método para obtener información valiosa sobre la tendencia central, la dispersión y la forma de la distribución de un conjunto de datos. El método describe() es una herramienta poderosa para el análisis y la exploración de datos. ¡Que disfrutes de la codificación!