データのグループ化と集約
このステップでは、GROUP BY
句を使用して遺物データを分析し、隠れたパターンを明らかにします。
- Hive シェルで、次のクエリを実行して、各遺物タイプの遺物の数をカウントします。
SELECT artifact_type, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY artifact_type;
このクエリは、artifact_type
でデータをグループ化し、COUNT(*)
関数を使用して各タイプの遺物の数を計算します。
- 最も一般的な遺物タイプを見つけるには、前のクエリに
ORDER BY
句を追加して変更します。
SELECT artifact_type, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY artifact_type
ORDER BY artifact_count DESC
LIMIT 1;
このクエリは、artifact_count
で結果を降順にソートし、出力を最初の行に制限して、最も多い数の遺物タイプを取得します。
- 遺物のタイプに基づいて遺物の状態を分析しましょう。次のクエリを実行します。
SELECT artifact_type, condition, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY artifact_type, condition
ORDER BY artifact_type, condition;
このクエリは、artifact_type
と condition
でデータをグループ化し、各組み合わせの遺物の数をカウントし、結果を artifact_type
と condition
でソートします。
- 最後に、次のクエリを実行して、異なる場所にわたる遺物の分布を調べます。
SELECT location, COUNT(*) AS artifact_count
FROM artifacts
GROUP BY location
ORDER BY artifact_count DESC;
このクエリは、location
でデータをグループ化し、各場所に見つかった遺物の数をカウントし、artifact_count
で降順にソートします。