Visualizando relaciones entre variables

Beginner

This tutorial is from open-source community. Access the source code

Introducción

En este laboratorio, aprenderemos a crear un diagrama de dispersión simple utilizando la biblioteca Matplotlib de Python. Un diagrama de dispersión es un tipo de gráfico que muestra los valores de dos variables como una colección de puntos. Cada punto representa los valores de las dos variables, y la posición del punto representa los valores de las dos variables. Los diagramas de dispersión son útiles para identificar relaciones entre variables y para identificar valores atípicos.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar las bibliotecas necesarias

En este paso, importaremos las bibliotecas necesarias para crear un diagrama de dispersión. Utilizaremos la biblioteca Matplotlib para crear el gráfico y la biblioteca NumPy para generar datos aleatorios.

import matplotlib.pyplot as plt
import numpy as np

Generar datos aleatorios

En este paso, generaremos datos aleatorios para nuestro diagrama de dispersión. Generaremos 50 puntos de datos para cada variable utilizando la biblioteca NumPy.

np.random.seed(19680801)

N = 50
x = np.random.rand(N)
y = np.random.rand(N)

Definir el tamaño y el color de los puntos

En este paso, definiremos el tamaño y el color de los puntos en nuestro diagrama de dispersión. Utilizaremos la biblioteca NumPy para generar valores aleatorios para el tamaño y el color de los puntos.

colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2

Crear el diagrama de dispersión

En este paso, crearemos el diagrama de dispersión utilizando la biblioteca Matplotlib. Utilizaremos la función scatter para crear el gráfico y especificar el tamaño y el color de los puntos.

plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()

Resumen

En este laboratorio, aprendimos cómo crear un diagrama de dispersión simple utilizando la biblioteca Matplotlib de Python. Generamos datos aleatorios para el gráfico utilizando la biblioteca NumPy, definimos el tamaño y el color de los puntos y creamos el gráfico utilizando la función scatter de la biblioteca Matplotlib. Los diagramas de dispersión son útiles para identificar relaciones entre variables y para identificar valores atípicos.