Visualizaciones con Matplotlib para el Análisis de Datos

PythonPythonBeginner
Practicar Ahora

This tutorial is from open-source community. Access the source code

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este tutorial, aprenderá a usar Matplotlib para crear visualizaciones en Python. Matplotlib es una popular biblioteca de visualización de datos en Python que se utiliza para crear una variedad de gráficos y diagramas. Con Matplotlib, puede crear diagramas de líneas, diagramas de dispersión, diagramas de barras, histogramas y muchos otros tipos de visualizaciones.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar Matplotlib

Antes de crear cualquier visualización, necesitamos importar la biblioteca Matplotlib. También usaremos la biblioteca NumPy para generar algunos datos de muestra.

import matplotlib.pyplot as plt
import numpy as np

Crear datos de muestra

Vamos a crear algunos datos de muestra que usaremos para crear visualizaciones. Generaremos cuatro conjuntos de datos, cada uno con 11 puntos de datos x,y.

x = [10, 8, 13, 9, 11, 14, 6, 4, 12, 7, 5]
y1 = [8.04, 6.95, 7.58, 8.81, 8.33, 9.96, 7.24, 4.26, 10.84, 4.82, 5.68]
y2 = [9.14, 8.14, 8.74, 8.77, 9.26, 8.10, 6.13, 3.10, 9.13, 7.26, 4.74]
y3 = [7.46, 6.77, 12.74, 7.11, 7.81, 8.84, 6.08, 5.39, 8.15, 6.42, 5.73]
x4 = [8, 8, 8, 8, 8, 8, 8, 19, 8, 8, 8]
y4 = [6.58, 5.76, 7.71, 8.84, 8.47, 7.04, 5.25, 12.50, 5.56, 7.91, 6.89]

Crear una figura con subgráficos

Ahora crearemos una figura con cuatro subgráficos, uno para cada conjunto de datos. También estableceremos los límites x e y para que sean los mismos para todos los subgráficos.

fig, axs = plt.subplots(2, 2, sharex=True, sharey=True, figsize=(6, 6),
                        gridspec_kw={'wspace': 0.08, 'hspace': 0.08})
axs[0, 0].set(xlim=(0, 20), ylim=(2, 14))
axs[0, 0].set(xticks=(0, 10, 20), yticks=(4, 8, 12))

Graficar los datos

Para cada subgráfico, graficaremos los puntos de datos x e y y agregaremos una línea de regresión lineal. También agregaremos un cuadro de texto con algunas estadísticas sobre los datos.

datasets = {
    'I': (x, y1),
    'II': (x, y2),
    'III': (x, y3),
    'IV': (x4, y4)
}

for ax, (label, (x, y)) in zip(axs.flat, datasets.items()):
    ax.text(0.1, 0.9, label, fontsize=20, transform=ax.transAxes, va='top')
    ax.tick_params(direction='in', top=True, right=True)
    ax.plot(x, y, 'o')

    ## linear regression
    p1, p0 = np.polyfit(x, y, deg=1)  ## pendiente, intersección
    ax.axline(xy1=(0, p0), slope=p1, color='r', lw=2)

    ## add text box for the statistics
    stats = (f'$\\mu$ = {np.mean(y):.2f}\n'
             f'$\\sigma$ = {np.std(y):.2f}\n'
             f'$r$ = {np.corrcoef(x, y)[0][1]:.2f}')
    bbox = dict(boxstyle='round', fc='blanchedalmond', ec='orange', alpha=0.5)
    ax.text(0.95, 0.07, stats, fontsize=9, bbox=bbox,
            transform=ax.transAxes, horizontalalignment='right')

plt.show()

Interpretar los resultados

La visualización resultante es un conjunto de cuatro subgráficos, cada uno mostrando un conjunto de datos diferente. Los límites x e y son los mismos para todos los subgráficos. Cada subgráfico contiene los puntos de datos x e y, así como una línea de regresión lineal. El cuadro de texto en la esquina inferior derecha de cada subgráfico muestra algunas estadísticas sobre los datos, incluyendo la media, la desviación estándar y el coeficiente de correlación.

Resumen

En este tutorial, aprendiste cómo usar Matplotlib para crear visualizaciones en Python. Aprendiste cómo crear una figura con subgráficos, graficar puntos de datos, agregar una línea de regresión lineal y agregar un cuadro de texto con estadísticas sobre los datos. Con Matplotlib, puedes crear una amplia variedad de visualizaciones para explorar y analizar tus datos.