Introducción
En este proyecto, aprenderás a limpiar y purificar datos CSV eliminando datos incompletos, incorrectos e inválidos. El objetivo es crear un conjunto de datos limpio a partir de los datos brutos, que se puede utilizar para análisis o procesamiento posteriores.
🎯 Tareas
En este proyecto, aprenderás:
- Cómo configurar el entorno del proyecto y preparar los archivos necesarios
- Cómo importar las bibliotecas necesarias para la limpieza de datos
- Cómo leer y procesar los datos brutos, comprobando diferentes tipos de datos sucios
- Cómo escribir los datos limpios en un nuevo archivo CSV
🏆 Logros
Después de completar este proyecto, podrás:
- Utilizar Python y su biblioteca estándar para trabajar con datos CSV
- Aplicar técnicas para validar y limpiar datos, como comprobar valores faltantes, formatos inválidos y datos poco realistas
- Implementar un proceso de limpieza de datos para crear un conjunto de datos de alta calidad
- Generar un nuevo archivo CSV con los datos limpios