Introducción
Este tutorial lo guiará a través del proceso de creación de diagramas de caja y diagramas de violín utilizando la biblioteca Python Matplotlib. Los diagramas de caja y los diagramas de violín se utilizan para visualizar la distribución de datos.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y lo resolveremos rápidamente para usted.
Importar bibliotecas
Antes de crear los gráficos, necesitamos importar las bibliotecas necesarias. Utilizaremos numpy para generar datos aleatorios y matplotlib.pyplot para crear los gráficos.
import matplotlib.pyplot as plt
import numpy as np
Generar datos
Generaremos algunos datos de prueba aleatorios utilizando numpy.
np.random.seed(19680801)
all_data = [np.random.normal(0, std, 100) for std in range(6, 10)]
Crear diagrama de violín
Crearemos un diagrama de violín utilizando el método violinplot(). Este método toma múltiples argumentos como datos, mostrar medias, mostrar medianas, etc.
fig, axs = plt.subplots(nrows=1, ncols=2, figsize=(9, 4))
axs[0].violinplot(all_data, showmeans=False, showmedians=True)
axs[0].set_title('Violin plot')
Crear diagrama de caja
Crearemos un diagrama de caja utilizando el método boxplot(). Este método toma múltiples argumentos como datos, etiquetas, mostrar medias, ranura, etc.
axs[1].boxplot(all_data)
axs[1].set_title('Box plot')
Agregar líneas de cuadrícula y etiquetas
Agregaremos líneas de cuadrícula horizontales, estableceremos etiquetas de eje x y etiquetas de eje y a los gráficos.
for ax in axs:
ax.yaxis.grid(True)
ax.set_xticks([y + 1 for y in range(len(all_data))], labels=['x1', 'x2', 'x3', 'x4'])
ax.set_xlabel('Four separate samples')
ax.set_ylabel('Observed values')
Mostrar los gráficos
Finalmente, mostraremos los gráficos utilizando el método show().
plt.show()
Resumen
En este tutorial, aprendimos cómo crear un diagrama de caja y un diagrama de violín utilizando la biblioteca Matplotlib de Python. También aprendimos cómo agregar líneas de cuadrícula horizontales, establecer etiquetas de eje x y etiquetas de eje y a los gráficos. Los diagramas de caja y los diagramas de violín son útiles para visualizar la distribución de datos.