Método de Cuantil de DataFrame de Pandas

Beginner

Introducción

En este laboratorio, exploraremos el método DataFrame.quantile() de Pandas. El método DataFrame.quantile() calcula los valores en un cuantil dado sobre el eje especificado de un DataFrame. Aprenderemos cómo usar este método y entender sus parámetros.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos rápidamente el problema para usted.

Crear un DataFrame

Primero, creemos un DataFrame utilizando la función pd.DataFrame() de la biblioteca Pandas. Crearemos un DataFrame con tres columnas: 'Edad', 'Altura' y 'Peso'. Este DataFrame representará a un grupo de personas y sus atributos correspondientes. Cada columna contendrá valores numéricos.

## Importar la biblioteca pandas
import pandas as pd

## Crear el DataFrame
df = pd.DataFrame({'Age': [12, 14, 11, 12], 'Height': [135, 140, 138, 147], 'Weight': [35, 38, 30, 45]})

Calcular el Cuantil

Ahora, calcularemos el cuantil del DataFrame utilizando el método DataFrame.quantile(). El parámetro q representa el cuantil (o cuantiles) deseado para calcular, donde 0 <= q <= 1. En este ejemplo, calcularemos el cuantil en 0.5, que corresponde a la mediana.

## Calcular el cuantil
quantile_50 = df.quantile(0.5)

Imprimir el Resultado

Finalmente, imprima el resultado para ver el cuantil calculado.

## Imprimir el resultado
print(quantile_50)

Resumen

En este laboratorio, aprendimos cómo usar el método DataFrame.quantile() de Pandas para calcular los cuantiles de un DataFrame. Al especificar el (los) cuantil(es) deseado(s) utilizando el parámetro q, podemos obtener los valores correspondientes. Este método es útil para analizar y resumir datos numéricos en un DataFrame.