Introducción
Matplotlib es una popular biblioteca de visualización de datos en Python. Proporciona una variedad de gráficos y diagramas personalizables para la exploración y presentación de datos. En este laboratorio, aprenderemos cómo trazar variables categóricas utilizando Matplotlib.
Consejos sobre la VM
Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no puede automatizarse debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Importar Matplotlib
El primer paso es importar la biblioteca Matplotlib. También usaremos la biblioteca numpy para generar algunos datos de muestra.
import matplotlib.pyplot as plt
import numpy as np
Preparar los datos
A continuación, prepararemos algunos datos de muestra para graficar. Crearemos un diccionario con las cantidades de diferentes frutas y luego extraeremos las claves y los valores en listas separadas.
data = {'apple': 10, 'orange': 15, 'lemon': 5, 'lime': 20}
names = list(data.keys())
values = list(data.values())
Gráfico de barras
Un gráfico de barras es una buena manera de mostrar datos categóricos. Podemos crear un gráfico de barras utilizando la función bar.
plt.bar(names, values)
plt.title('Fruit Counts')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()
Gráfico de dispersión
También podemos crear un gráfico de dispersión para mostrar la relación entre dos variables categóricas. En este caso, usaremos los mismos datos de frutas y agregaremos algo de ruido aleatorio a las cantidades para crear una segunda variable.
noise = np.random.rand(len(values)) * 5
plt.scatter(names, values + noise)
plt.title('Fruit Counts with Noise')
plt.xlabel('Fruit')
plt.ylabel('Count')
plt.show()
Gráfico de línea
Un gráfico de línea se puede utilizar para mostrar cómo una variable categórica cambia con el tiempo. En este ejemplo, usaremos datos sobre los niveles de felicidad de los gatos y los perros durante diferentes actividades.
cat = ["bored", "happy", "bored", "bored", "happy", "bored"]
dog = ["happy", "happy", "happy", "happy", "bored", "bored"]
activity = ["combing", "drinking", "feeding", "napping", "playing", "washing"]
plt.plot(activity, dog, label="dog")
plt.plot(activity, cat, label="cat")
plt.title('Happiness Levels')
plt.xlabel('Activity')
plt.ylabel('Happiness')
plt.legend()
plt.show()
Resumen
En este laboratorio, aprendimos cómo graficar variables categóricas utilizando Matplotlib. Creamos gráficos de barras, gráficos de dispersión y gráficos de línea para visualizar diferentes tipos de datos categóricos. Al personalizar las etiquetas de los ejes, los títulos y las leyendas, podemos crear gráficos informativos y visualmente atractivos para comunicar nuestros datos de manera efectiva.