Tutorial de Histogramas con Python Matplotlib

PythonPythonBeginner
Practicar Ahora

This tutorial is from open-source community. Access the source code

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

Esta práctica es un tutorial paso a paso sobre cómo utilizar la librería Python Matplotlib para crear un histograma. Un histograma es una representación gráfica de la distribución de datos numéricos. Es una estimación de la distribución de probabilidad de una variable continua.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar las bibliotecas necesarias

En este paso, importaremos dos bibliotecas: numpy y matplotlib. Numpy es una biblioteca para el lenguaje de programación Python que agrega soporte para matrices y arreglos multidimensionales de gran tamaño. Matplotlib es una biblioteca de trazado para el lenguaje de programación Python.

import numpy as np
import matplotlib.pyplot as plt

Generar datos de muestra

En este paso, generaremos datos de muestra utilizando numpy. Generaremos datos aleatorios a partir de una distribución normal con una media de 100 y una desviación estándar de 15.

np.random.seed(19680801)
mu = 100  ## media de la distribución
sigma = 15  ## desviación estándar de la distribución
x = mu + sigma * np.random.randn(437)

Crear un histograma

En este paso, crearemos un histograma utilizando matplotlib. Estableceremos el número de intervalos en 50 y habilitaremos el parámetro de densidad para normalizar las alturas de los intervalos de modo que la integral del histograma sea 1.

num_bins = 50
fig, ax = plt.subplots()
n, bins, patches = ax.hist(x, num_bins, density=True)

Agregar una línea de mejor ajuste

En este paso, agregaremos una línea de mejor ajuste al histograma. Calcularemos los valores de y para la línea y la graficaremos encima del histograma.

y = ((1 / (np.sqrt(2 * np.pi) * sigma)) *
     np.exp(-0.5 * (1 / sigma * (bins - mu))**2))
ax.plot(bins, y, '--')

Personalizar el histograma

En este paso, personalizaremos el histograma agregando etiquetas, título y ajustando el diseño.

ax.set_xlabel('Smarts')
ax.set_ylabel('Probabilidad de densidad')
ax.set_title(r'Histograma de IQ: $\mu=100$, $\sigma=15$')
fig.tight_layout()
plt.show()

Resumen

En este laboratorio, aprendimos cómo utilizar la biblioteca Matplotlib de Python para crear un histograma. Generamos datos de muestra a partir de una distribución normal y creamos un histograma utilizando Matplotlib. También agregamos una línea de mejor ajuste y personalizamos el histograma agregando etiquetas y un título.