Introducción
En este laboratorio, aprenderemos a crear un diagrama de dispersión simple utilizando la biblioteca Matplotlib de Python. Un diagrama de dispersión es un tipo de gráfico que muestra los valores de dos variables como una colección de puntos. Cada punto representa los valores de las dos variables, y la posición del punto representa los valores de las dos variables. Los diagramas de dispersión son útiles para identificar relaciones entre variables y para identificar valores atípicos.
Consejos sobre la VM
Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.
A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.
Importar las bibliotecas necesarias
En este paso, importaremos las bibliotecas necesarias para crear un diagrama de dispersión. Utilizaremos la biblioteca Matplotlib para crear el gráfico y la biblioteca NumPy para generar datos aleatorios.
import matplotlib.pyplot as plt
import numpy as np
Generar datos aleatorios
En este paso, generaremos datos aleatorios para nuestro diagrama de dispersión. Generaremos 50 puntos de datos para cada variable utilizando la biblioteca NumPy.
np.random.seed(19680801)
N = 50
x = np.random.rand(N)
y = np.random.rand(N)
Definir el tamaño y el color de los puntos
En este paso, definiremos el tamaño y el color de los puntos en nuestro diagrama de dispersión. Utilizaremos la biblioteca NumPy para generar valores aleatorios para el tamaño y el color de los puntos.
colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2
Crear el diagrama de dispersión
En este paso, crearemos el diagrama de dispersión utilizando la biblioteca Matplotlib. Utilizaremos la función scatter para crear el gráfico y especificar el tamaño y el color de los puntos.
plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()
Resumen
En este laboratorio, aprendimos cómo crear un diagrama de dispersión simple utilizando la biblioteca Matplotlib de Python. Generamos datos aleatorios para el gráfico utilizando la biblioteca NumPy, definimos el tamaño y el color de los puntos y creamos el gráfico utilizando la función scatter de la biblioteca Matplotlib. Los diagramas de dispersión son útiles para identificar relaciones entre variables y para identificar valores atípicos.