Agrupamiento y agregación de datos
En este paso, usaremos la cláusula GROUP BY
para analizar los datos de los artefactos y descubrir patrones ocultos.
- En la shell de Hive, ejecute la siguiente consulta para contar el número de artefactos de cada tipo de artefacto:
SELECT artifact_type, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY artifact_type;
Esta consulta agrupa los datos por artifact_type
y calcula la cuenta de artefactos de cada tipo usando la función COUNT(*)
.
- Para encontrar el tipo de artefacto más común, modifique la consulta anterior agregando una cláusula
ORDER BY
:
SELECT artifact_type, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY artifact_type
ORDER BY artifact_count DESC
LIMIT 1;
Esta consulta ordena los resultados por artifact_count
en orden descendente y limita la salida a la primera fila, lo que nos da el tipo de artefacto con la mayor cuenta.
- Analicemos la condición de los artefactos según su tipo. Ejecute la siguiente consulta:
SELECT artifact_type, condition, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY artifact_type, condition
ORDER BY artifact_type, condition;
Esta consulta agrupa los datos por artifact_type
y condition
, cuenta el número de artefactos para cada combinación y ordena los resultados por artifact_type
y condition
.
- Finalmente, podemos explorar la distribución de los artefactos en diferentes ubicaciones ejecutando la siguiente consulta:
SELECT location, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY location
ORDER BY artifact_count DESC;
Esta consulta agrupa los datos por location
y cuenta el número de artefactos encontrados en cada ubicación, ordenados en orden descendente por artifact_count
.