Introducción
Matplotlib es una popular biblioteca de visualización de datos en Python. Una de las maneras más comunes de visualizar distribuciones de datos es mediante el uso de histogramas. En este laboratorio, aprenderemos cómo crear histogramas con Matplotlib y explorar diferentes opciones de personalización.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no puede automatizarse debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos rápidamente el problema para usted.
Importar las bibliotecas necesarias
En primer lugar, necesitamos importar las bibliotecas necesarias, incluyendo Matplotlib y NumPy.
import matplotlib.pyplot as plt
import numpy as np
Generar datos de muestra
A continuación, generaremos algunos datos de muestra para utilizar en el histograma. En este ejemplo, generaremos tres conjuntos de datos aleatorios.
np.random.seed(19680801)
n_bins = 10
x = np.random.randn(1000, 3)
Trazar un histograma básico
Podemos crear un histograma básico utilizando la función hist en Matplotlib. Esta función toma los datos que queremos trazar y el número de intervalos que queremos utilizar.
plt.hist(x, n_bins)
plt.show()
Agregar etiquetas y un título
Podemos agregar etiquetas a los ejes x e y y un título al gráfico utilizando las funciones xlabel, ylabel y title.
plt.hist(x, n_bins)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()
Personalizar el histograma
Podemos personalizar el histograma cambiando el color, la transparencia y el color del borde de las barras utilizando los parámetros color, alpha y edgecolor.
plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()
Trazar múltiples histogramas
Podemos trazar múltiples histogramas en la misma gráfica pasando una matriz de datos a la función hist.
plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.legend()
plt.show()
Trazar histogramas apilados
Podemos trazar histogramas apilados estableciendo el parámetro stacked en True.
plt.hist(x, n_bins, color=['green', 'blue','red'], alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'], stacked=True)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Stacked Histogram of Random Data')
plt.legend()
plt.show()
Trazar histogramas de escalón
Podemos trazar histogramas de escalón estableciendo el parámetro histtype en 'step'.
plt.hist(x, n_bins, histtype='step', color=['green', 'blue','red'], label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Step Histogram of Random Data')
plt.legend()
plt.show()
Resumen
En este laboratorio, aprendimos cómo crear histogramas utilizando Matplotlib. Exploramos diferentes opciones de personalización, incluyendo cambiar el color, la transparencia y el color del borde de las barras, trazar múltiples histogramas en la misma gráfica, apilar histogramas y trazar histogramas de escalón. Estas herramientas pueden ayudarnos a entender mejor la distribución de nuestros datos.