Introducción
Este laboratorio se centra en cómo escalar el análisis de datos a conjuntos de datos más grandes utilizando pandas. Cubre métodos como cargar menos datos, utilizar tipos de datos eficientes, dividir en fragmentos (chunking) y aprovechar otras bibliotecas como Dask. Es importante tener en cuenta que pandas es más adecuado para el análisis en memoria y puede que no sea la mejor herramienta para conjuntos de datos muy grandes.
Consejos para la MV
Después de que la máquina virtual (VM) haya terminado de iniciar, haz clic en la esquina superior izquierda para cambiar a la pestaña Notebook y acceder a Jupyter Notebook para practicar.
A veces, es posible que debas esperar unos segundos para que Jupyter Notebook termine de cargar. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si encuentras problemas durante el aprendizaje, no dudes en preguntarle a Labby. Proporciona comentarios después de la sesión y resolveremos rápidamente el problema para ti.