Visualizando relaciones entre variables

PythonPythonBeginner
Practicar Ahora

This tutorial is from open-source community. Access the source code

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos a crear un diagrama de dispersión simple utilizando la biblioteca Matplotlib de Python. Un diagrama de dispersión es un tipo de gráfico que muestra los valores de dos variables como una colección de puntos. Cada punto representa los valores de las dos variables, y la posición del punto representa los valores de las dos variables. Los diagramas de dispersión son útiles para identificar relaciones entre variables y para identificar valores atípicos.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/DataStructuresGroup(["Data Structures"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) matplotlib(("Matplotlib")) -.-> matplotlib/BasicConceptsGroup(["Basic Concepts"]) matplotlib(("Matplotlib")) -.-> matplotlib/PlottingDataGroup(["Plotting Data"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) matplotlib/BasicConceptsGroup -.-> matplotlib/importing_matplotlib("Importing Matplotlib") matplotlib/BasicConceptsGroup -.-> matplotlib/figures_axes("Understanding Figures and Axes") matplotlib/PlottingDataGroup -.-> matplotlib/scatter_plots("Scatter Plots") python/DataStructuresGroup -.-> python/tuples("Tuples") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/ModulesandPackagesGroup -.-> python/standard_libraries("Common Standard Libraries") python/PythonStandardLibraryGroup -.-> python/math_random("Math and Random") python/DataScienceandMachineLearningGroup -.-> python/numerical_computing("Numerical Computing") python/DataScienceandMachineLearningGroup -.-> python/data_visualization("Data Visualization") subgraph Lab Skills matplotlib/importing_matplotlib -.-> lab-48918{{"Visualizando relaciones entre variables"}} matplotlib/figures_axes -.-> lab-48918{{"Visualizando relaciones entre variables"}} matplotlib/scatter_plots -.-> lab-48918{{"Visualizando relaciones entre variables"}} python/tuples -.-> lab-48918{{"Visualizando relaciones entre variables"}} python/importing_modules -.-> lab-48918{{"Visualizando relaciones entre variables"}} python/standard_libraries -.-> lab-48918{{"Visualizando relaciones entre variables"}} python/math_random -.-> lab-48918{{"Visualizando relaciones entre variables"}} python/numerical_computing -.-> lab-48918{{"Visualizando relaciones entre variables"}} python/data_visualization -.-> lab-48918{{"Visualizando relaciones entre variables"}} end

Importar las bibliotecas necesarias

En este paso, importaremos las bibliotecas necesarias para crear un diagrama de dispersión. Utilizaremos la biblioteca Matplotlib para crear el gráfico y la biblioteca NumPy para generar datos aleatorios.

import matplotlib.pyplot as plt
import numpy as np

Generar datos aleatorios

En este paso, generaremos datos aleatorios para nuestro diagrama de dispersión. Generaremos 50 puntos de datos para cada variable utilizando la biblioteca NumPy.

np.random.seed(19680801)

N = 50
x = np.random.rand(N)
y = np.random.rand(N)

Definir el tamaño y el color de los puntos

En este paso, definiremos el tamaño y el color de los puntos en nuestro diagrama de dispersión. Utilizaremos la biblioteca NumPy para generar valores aleatorios para el tamaño y el color de los puntos.

colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2

Crear el diagrama de dispersión

En este paso, crearemos el diagrama de dispersión utilizando la biblioteca Matplotlib. Utilizaremos la función scatter para crear el gráfico y especificar el tamaño y el color de los puntos.

plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()

Resumen

En este laboratorio, aprendimos cómo crear un diagrama de dispersión simple utilizando la biblioteca Matplotlib de Python. Generamos datos aleatorios para el gráfico utilizando la biblioteca NumPy, definimos el tamaño y el color de los puntos y creamos el gráfico utilizando la función scatter de la biblioteca Matplotlib. Los diagramas de dispersión son útiles para identificar relaciones entre variables y para identificar valores atípicos.