Crear colores de relleno personalizados para diagramas de caja

PythonPythonBeginner
Practicar Ahora

This tutorial is from open-source community. Access the source code

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

Este tutorial lo guiará a través del proceso de creación de colores de relleno personalizados para diagramas de caja utilizando Python Matplotlib. Los diagramas de caja son un tipo de gráfico utilizado para mostrar la distribución de un conjunto de datos. Muestran la mediana, los cuartiles y los valores atípicos del conjunto de datos. En este tutorial, usaremos la función boxplot() en Matplotlib para crear dos tipos de diagramas de caja (rectangulares y con muesca) y rellenarlos con colores personalizados.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y lo resolveremos rápidamente para usted.

Importando las bibliotecas necesarias

Comenzaremos importando las bibliotecas necesarias. En este ejemplo, usaremos las bibliotecas numpy y matplotlib.pyplot.

import matplotlib.pyplot as plt
import numpy as np

Creando datos de prueba aleatorios

A continuación, crearemos datos de prueba aleatorios utilizando la biblioteca numpy. Generaremos 3 conjuntos de datos, cada uno con una desviación estándar diferente.

np.random.seed(19680801)
all_data = [np.random.normal(0, std, size=100) for std in range(1, 4)]
labels = ['x1', 'x2', 'x3']

Creando un diagrama de caja rectangular

Ahora crearemos un diagrama de caja rectangular utilizando la función boxplot() en Matplotlib. Estableceremos el parámetro patch_artist en True para rellenar la caja con color.

fig, ax1 = plt.subplots(figsize=(9, 4))
bplot1 = ax1.boxplot(all_data,
                     vert=True,  ## alineación vertical de la caja
                     patch_artist=True,  ## rellenar con color
                     labels=labels)  ## etiquetas de las marcas del eje x
ax1.set_title('Diagrama de caja rectangular')

Creando un diagrama de caja con muesca

Ahora crearemos un diagrama de caja con muesca con la función boxplot(). Estableceremos el parámetro notch en True para crear un diagrama de caja con muesca.

fig, ax2 = plt.subplots(figsize=(9, 4))
bplot2 = ax2.boxplot(all_data,
                     notch=True,  ## forma de la muesca
                     vert=True,  ## alineación vertical de la caja
                     patch_artist=True,  ## rellenar con color
                     labels=labels)  ## etiquetas de las marcas del eje x
ax2.set_title('Diagrama de caja con muesca')

Rellenando los diagramas de caja con colores personalizados

A continuación, rellenaremos los diagramas de caja con colores personalizados. Crearemos una lista de colores y usaremos un bucle para rellenar cada caja con un color diferente.

colors = ['pink', 'lightblue', 'lightgreen']
for bplot in (bplot1, bplot2):
    for patch, color in zip(bplot['boxes'], colors):
        patch.set_facecolor(color)

Agregando líneas de cuadrícula horizontales

Finalmente, agregaremos líneas de cuadrícula horizontales a los diagramas de caja utilizando la función yaxis.grid().

for ax in [ax1, ax2]:
    ax.yaxis.grid(True)
    ax.set_xlabel('Tres Muestras Separadas')
    ax.set_ylabel('Valores Observados')

plt.show()

Resumen

En este tutorial, aprendimos cómo crear colores de relleno personalizados para diagramas de caja utilizando Python Matplotlib. Comenzamos importando las bibliotecas necesarias, creando datos de prueba aleatorios y luego creando diagramas de caja rectangulares y con muesca. Luego rellenamos los diagramas de caja con colores personalizados y agregamos líneas de cuadrícula horizontales. Los diagramas de caja son una herramienta de visualización útil para mostrar la distribución de datos y los colores de relleno personalizados se pueden utilizar para hacerlos más atractivos visualmente.