Gruppieren und Aggregieren von Daten
In diesem Schritt werden wir die GROUP BY
-Klausel verwenden, um die Artefakt-Daten zu analysieren und verborgene Muster zu entdecken.
- In der Hive-Shell führen Sie die folgende Abfrage aus, um die Anzahl der Artefakte für jede Artefaktart zu zählen:
SELECT artifact_type, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY artifact_type;
Diese Abfrage gruppiert die Daten nach artifact_type
und berechnet die Anzahl der Artefakte für jede Art mit der COUNT(*)
-Funktion.
- Um die häufigste Artefaktart zu finden, modifizieren Sie die vorherige Abfrage, indem Sie eine
ORDER BY
-Klausel hinzufügen:
SELECT artifact_type, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY artifact_type
ORDER BY artifact_count DESC
LIMIT 1;
Diese Abfrage sortiert die Ergebnisse nach artifact_count
in absteigender Reihenfolge und begrenzt die Ausgabe auf die erste Zeile, was uns die Artefaktart mit der höchsten Anzahl gibt.
- Analysieren wir den Zustand der Artefakte basierend auf ihrer Art. Führen Sie die folgende Abfrage aus:
SELECT artifact_type, condition, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY artifact_type, condition
ORDER BY artifact_type, condition;
Diese Abfrage gruppiert die Daten nach artifact_type
und condition
, zählt die Anzahl der Artefakte für jede Kombination und sortiert die Ergebnisse nach artifact_type
und condition
.
- Schließlich können wir die Verteilung der Artefakte über verschiedene Orte erkunden, indem wir die folgende Abfrage ausführen:
SELECT location, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY location
ORDER BY artifact_count DESC;
Diese Abfrage gruppiert die Daten nach location
und zählt die Anzahl der Artefakte, die an jedem Ort gefunden wurden, sortiert in absteigender Reihenfolge nach artifact_count
.