Introducción
En este tutorial, aprenderá a usar Matplotlib para crear visualizaciones en Python. Matplotlib es una popular biblioteca de visualización de datos en Python que se utiliza para crear una variedad de gráficos y diagramas. Con Matplotlib, puede crear diagramas de líneas, diagramas de dispersión, diagramas de barras, histogramas y muchos otros tipos de visualizaciones.
Consejos sobre la VM
Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Importar Matplotlib
Antes de crear cualquier visualización, necesitamos importar la biblioteca Matplotlib. También usaremos la biblioteca NumPy para generar algunos datos de muestra.
import matplotlib.pyplot as plt
import numpy as np
Crear datos de muestra
Vamos a crear algunos datos de muestra que usaremos para crear visualizaciones. Generaremos cuatro conjuntos de datos, cada uno con 11 puntos de datos x,y.
x = [10, 8, 13, 9, 11, 14, 6, 4, 12, 7, 5]
y1 = [8.04, 6.95, 7.58, 8.81, 8.33, 9.96, 7.24, 4.26, 10.84, 4.82, 5.68]
y2 = [9.14, 8.14, 8.74, 8.77, 9.26, 8.10, 6.13, 3.10, 9.13, 7.26, 4.74]
y3 = [7.46, 6.77, 12.74, 7.11, 7.81, 8.84, 6.08, 5.39, 8.15, 6.42, 5.73]
x4 = [8, 8, 8, 8, 8, 8, 8, 19, 8, 8, 8]
y4 = [6.58, 5.76, 7.71, 8.84, 8.47, 7.04, 5.25, 12.50, 5.56, 7.91, 6.89]
Crear una figura con subgráficos
Ahora crearemos una figura con cuatro subgráficos, uno para cada conjunto de datos. También estableceremos los límites x e y para que sean los mismos para todos los subgráficos.
fig, axs = plt.subplots(2, 2, sharex=True, sharey=True, figsize=(6, 6),
gridspec_kw={'wspace': 0.08, 'hspace': 0.08})
axs[0, 0].set(xlim=(0, 20), ylim=(2, 14))
axs[0, 0].set(xticks=(0, 10, 20), yticks=(4, 8, 12))
Graficar los datos
Para cada subgráfico, graficaremos los puntos de datos x e y y agregaremos una línea de regresión lineal. También agregaremos un cuadro de texto con algunas estadísticas sobre los datos.
datasets = {
'I': (x, y1),
'II': (x, y2),
'III': (x, y3),
'IV': (x4, y4)
}
for ax, (label, (x, y)) in zip(axs.flat, datasets.items()):
ax.text(0.1, 0.9, label, fontsize=20, transform=ax.transAxes, va='top')
ax.tick_params(direction='in', top=True, right=True)
ax.plot(x, y, 'o')
## linear regression
p1, p0 = np.polyfit(x, y, deg=1) ## pendiente, intersección
ax.axline(xy1=(0, p0), slope=p1, color='r', lw=2)
## add text box for the statistics
stats = (f'$\\mu$ = {np.mean(y):.2f}\n'
f'$\\sigma$ = {np.std(y):.2f}\n'
f'$r$ = {np.corrcoef(x, y)[0][1]:.2f}')
bbox = dict(boxstyle='round', fc='blanchedalmond', ec='orange', alpha=0.5)
ax.text(0.95, 0.07, stats, fontsize=9, bbox=bbox,
transform=ax.transAxes, horizontalalignment='right')
plt.show()
Interpretar los resultados
La visualización resultante es un conjunto de cuatro subgráficos, cada uno mostrando un conjunto de datos diferente. Los límites x e y son los mismos para todos los subgráficos. Cada subgráfico contiene los puntos de datos x e y, así como una línea de regresión lineal. El cuadro de texto en la esquina inferior derecha de cada subgráfico muestra algunas estadísticas sobre los datos, incluyendo la media, la desviación estándar y el coeficiente de correlación.
Resumen
En este tutorial, aprendiste cómo usar Matplotlib para crear visualizaciones en Python. Aprendiste cómo crear una figura con subgráficos, graficar puntos de datos, agregar una línea de regresión lineal y agregar un cuadro de texto con estadísticas sobre los datos. Con Matplotlib, puedes crear una amplia variedad de visualizaciones para explorar y analizar tus datos.