Validar los datos importados
En este paso, aprenderá cómo validar los datos que se han importado a su tabla de MySQL. La validación de datos es un paso importante para garantizar la precisión e integridad de sus datos. Cubriremos algunas técnicas básicas de validación utilizando consultas SQL.
Primero, agreguemos algunos datos potencialmente problemáticos a nuestra tabla employees
. Abra una terminal y use nano
para crear el archivo:
nano ~/project/employees_validation.csv
Ahora, pegue los siguientes datos en el archivo employees_validation.csv
. Tenga en cuenta que la última fila tiene un formato de correo electrónico no válido y falta el departamento:
3,Invalid,Email,invalid_email,Sales
4,Missing,Department,[email protected],
Presione Ctrl+X
, luego Y
y luego Enter
para guardar el archivo.
Ahora, importemos estos datos a nuestra tabla employees
. Conéctese al servidor MySQL:
mysql -u root -p
Si se le solicita una contraseña y no la ha configurado, simplemente presione Enter
.
Ejecute las siguientes declaraciones SQL en la shell de MySQL:
USE company;
LOAD DATA INFILE '/home/labex/project/employees_validation.csv'
INTO TABLE employees
CHARACTER SET utf8
FIELDS TERMINATED BY ','
ENCLOSED BY '"'
LINES TERMINATED BY '\n';
Ahora que hemos importado los datos, realicemos algunas comprobaciones de validación.
1. Comprobar formatos de correo electrónico no válidos:
Podemos usar una expresión regular para comprobar formatos de correo electrónico no válidos. Ejecute la siguiente consulta SQL:
SELECT * FROM employees WHERE email NOT LIKE '%@%.%';
Esta consulta devolverá cualquier fila en la que la columna email
no contenga los caracteres @
y .
, que son esenciales para una dirección de correo electrónico válida. Debería ver la fila con invalid_email
en el resultado.
2. Comprobar departamentos faltantes:
Podemos comprobar los departamentos faltantes buscando cadenas vacías en la columna department
. Ejecute la siguiente consulta SQL:
SELECT * FROM employees WHERE department = '';
Esta consulta devolverá cualquier fila en la que la columna department
esté vacía. Debería ver la fila con el departamento faltante en el resultado.
3. Comprobar IDs duplicados:
Aunque no hemos introducido IDs duplicados en este ejemplo, es una comprobación de validación común. Puede usar la siguiente consulta para encontrar IDs duplicados:
SELECT id, COUNT(*) FROM employees GROUP BY id HAVING COUNT(*) > 1;
Esta consulta devolverá cualquier ID que aparezca más de una vez en la tabla employees
.
4. Comprobar coincidencias de tipos de datos:
MySQL generalmente manejará las coincidencias de tipos de datos durante el proceso de importación, pero aún es una buena idea comprobar. Por ejemplo, si tiene una columna numérica que solo debe contener valores positivos, puede comprobar valores negativos.
Estos son solo algunos ejemplos de cómo puede validar los datos importados utilizando consultas SQL. Las comprobaciones de validación específicas que debe realizar dependerán de la estructura y el contenido de sus datos.
Finalmente, salga de la shell de MySQL:
exit