Comment activer l'autorisation Apache Ranger pour un accès sécurisé au Hive Metastore

HadoopHadoopBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Ce tutoriel vous guidera tout au long du processus d'activation de l'autorisation Apache Ranger pour un accès sécurisé à votre Hadoop Hive Metastore. À la fin de cet article, vous comprendrez comment configurer Ranger et mettre en œuvre des politiques pour contrôler qui peut accéder à votre Hive Metastore et aux données qu'il gère.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL hadoop(("Hadoop")) -.-> hadoop/HadoopHiveGroup(["Hadoop Hive"]) hadoop/HadoopHiveGroup -.-> hadoop/hive_setup("Hive Setup") hadoop/HadoopHiveGroup -.-> hadoop/manage_db("Managing Database") hadoop/HadoopHiveGroup -.-> hadoop/create_tables("Creating Tables") hadoop/HadoopHiveGroup -.-> hadoop/describe_tables("Describing Tables") hadoop/HadoopHiveGroup -.-> hadoop/secure_hive("Securing Hive") subgraph Lab Skills hadoop/hive_setup -.-> lab-417731{{"Comment activer l'autorisation Apache Ranger pour un accès sécurisé au Hive Metastore"}} hadoop/manage_db -.-> lab-417731{{"Comment activer l'autorisation Apache Ranger pour un accès sécurisé au Hive Metastore"}} hadoop/create_tables -.-> lab-417731{{"Comment activer l'autorisation Apache Ranger pour un accès sécurisé au Hive Metastore"}} hadoop/describe_tables -.-> lab-417731{{"Comment activer l'autorisation Apache Ranger pour un accès sécurisé au Hive Metastore"}} hadoop/secure_hive -.-> lab-417731{{"Comment activer l'autorisation Apache Ranger pour un accès sécurisé au Hive Metastore"}} end

Introduction à Apache Ranger

Apache Ranger est un framework open-source qui offre une solution complète de gestion de la sécurité pour les plateformes de données massives. Il propose une administration de la sécurité centralisée, un contrôle d'accès précis et des capacités d'audit complètes pour les différents composants de l'écosystème Hadoop, notamment Hive, HDFS, HBase, etc.

Qu'est-ce qu'Apache Ranger ?

Apache Ranger est conçu pour répondre aux défis de sécurité auxquels sont confrontées les organisations qui ont adopté les technologies de données massives. Il fournit une plateforme centralisée pour définir, administrer et surveiller les politiques de sécurité sur plusieurs composants Hadoop, garantissant un contrôle d'accès et un audit cohérents et efficaces.

Principales fonctionnalités d'Apache Ranger

  1. Gestion centralisée des politiques : Ranger permet aux administrateurs de définir et de gérer les politiques de sécurité à partir d'une seule console web, simplifiant ainsi le processus de mise en œuvre des contrôles d'accès dans l'écosystème Hadoop.

  2. Contrôle d'accès précis : Ranger prend en charge un contrôle d'accès granulaire, permettant aux administrateurs de définir des politiques en fonction de différents attributs, tels que l'utilisateur, le groupe, la ressource et le type d'accès (lecture, écriture, exécution).

  3. Audit complet : Ranger fournit un système d'audit robuste qui suit et enregistre toutes les tentatives d'accès, permettant aux administrateurs de surveiller et d'analyser les activités des utilisateurs à des fins de sécurité et de conformité.

  4. Intégration transparente : Ranger s'intègre à différents composants Hadoop, notamment Hive, HDFS, HBase et Kafka, offrant une solution unifiée de gestion de la sécurité pour toute la pile de données massives.

  5. Modèle de politique flexible : Le modèle de politique de Ranger est conçu pour être flexible et extensible, permettant aux organisations de personnaliser et d'adapter les politiques de sécurité à leurs besoins spécifiques.

Cas d'utilisation typiques d'Apache Ranger

  1. Accès sécurisé aux données : Ranger garantit que seuls les utilisateurs et les applications autorisés peuvent accéder aux données sensibles stockées dans les composants Hadoop, tels que Hive, HDFS et HBase.

  2. Conformité réglementaire : Les capacités d'audit complètes de Ranger aident les organisations à répondre aux exigences réglementaires, telles que le RGPD, la HIPAA et le PCI-DSS, en fournissant des journaux d'accès et des rapports détaillés.

  3. Sécurité multi-locataire : Ranger permet une multi-location sécurisée dans les environnements Hadoop, permettant à différentes équipes ou départements d'accéder et de gérer leurs propres données et ressources tout en maintenant des contrôles d'accès stricts.

  4. Gouvernance des données : Les fonctionnalités de gestion centralisée des politiques et de contrôle d'accès précis de Ranger aident les organisations à appliquer les politiques de gouvernance des données et à garantir la confidentialité et la sécurité des données.

Dans la section suivante, nous explorerons comment configurer Apache Ranger pour sécuriser l'accès au Hive Metastore.

Configuration de Ranger pour l'accès au Hive Metastore

Pour sécuriser le Hive Metastore avec Apache Ranger, vous devez configurer Ranger pour qu'il s'intègre au service Hive Metastore. Voici un guide étape par étape :

Prérequis

  1. Installez et configurez Apache Ranger sur votre cluster Hadoop.
  2. Assurez-vous que le service Hive Metastore est en cours d'exécution et accessible.

Étapes pour configurer Ranger pour l'accès au Hive Metastore

  1. Activer le plugin Ranger pour le Hive Metastore :

    • Localisez le fichier de configuration du Hive Metastore (généralement hive-site.xml) et ajoutez les propriétés suivantes :
      <property>
        <name>hive.security.authorization.manager</name>
        <value>org.apache.ranger.authorization.hive.authorizer.RangerHiveAuthorizerFactory</value>
      </property>
      <property>
        <name>hive.security.authenticator.manager</name>
        <value>org.apache.hadoop.hive.ql.security.SessionStateUserAuthenticator</value>
      </property>
    • Redémarrez le service Hive Metastore pour que les modifications prennent effet.
  2. Configurer les politiques Ranger pour le Hive Metastore :

    • Connectez-vous à l'interface utilisateur d'administration de Ranger (Ranger Admin UI).
    • Accédez au service "Hive" et créez une nouvelle politique pour contrôler l'accès au Hive Metastore.
    • Définissez la politique en fonction des exigences de sécurité de votre organisation, par exemple :
      • Spécifiez l'utilisateur ou le groupe qui devrait avoir accès.
      • Sélectionnez les autorisations appropriées (par exemple, lecture, écriture, création, suppression).
      • Choisissez les ressources Hive pertinentes (bases de données, tables, colonnes) auxquelles la politique devrait s'appliquer.
  3. Vérifier l'application des politiques Ranger :

    • Essayez d'accéder au Hive Metastore en utilisant différents comptes utilisateur et vérifiez que les politiques Ranger sont correctement appliquées.
    • Vérifiez les journaux d'audit de Ranger pour vous assurer que toutes les tentatives d'accès sont enregistrées et surveillées.
graph LR A[Hive Client] --> B[Hive Metastore] B --> C[Ranger Plugin] C --> D[Ranger Admin] D --> E[Ranger Policies]

En suivant ces étapes, vous pouvez activer Apache Ranger pour sécuriser le Hive Metastore et vous assurer que seuls les utilisateurs et les applications autorisés peuvent accéder aux métadonnées stockées dans le Hive Metastore.

Sécurisation du Hive Metastore avec des politiques Ranger

Après avoir configuré Ranger pour qu'il s'intègre au Hive Metastore, l'étape suivante consiste à définir et à appliquer des politiques Ranger pour sécuriser l'accès au Hive Metastore.

Compréhension des politiques Ranger pour le Hive Metastore

Les politiques Ranger pour le Hive Metastore vous permettent de contrôler l'accès à diverses ressources Hive, telles que les bases de données, les tables et les colonnes. Vous pouvez définir des politiques en fonction des critères suivants :

  • Utilisateurs/Groups : Spécifiez les utilisateurs ou les groupes qui devraient avoir accès aux ressources Hive.
  • Autorisations : Définissez le type d'accès (lecture, écriture, création, suppression) qui devrait être accordé ou refusé.
  • Ressources : Sélectionnez les bases de données, les tables ou les colonnes Hive spécifiques auxquelles la politique devrait s'appliquer.

Création de politiques Ranger pour le Hive Metastore

  1. Connectez-vous à l'interface utilisateur d'administration de Ranger (Ranger Admin UI) :

    • Accédez à la console d'administration de Ranger, généralement disponible à l'adresse http://<ranger-admin-host>:6080.
  2. Accédez au service Hive :

    • Dans l'interface utilisateur d'administration de Ranger, localisez le service "Hive" et cliquez dessus pour gérer les politiques liées à Hive.
  3. Créez une nouvelle politique Hive :

    • Cliquez sur le bouton "Add New Policy" pour créer une nouvelle politique Hive.
    • Donnez un nom significatif à la politique, par exemple "Restrict access to sensitive Hive tables" (Restreindre l'accès aux tables Hive sensibles).
  4. Configurez les détails de la politique :

    • Ressources : Sélectionnez les bases de données, les tables ou les colonnes Hive auxquelles la politique devrait s'appliquer. Vous pouvez utiliser des caractères génériques (par exemple, db_name.*) pour appliquer la politique à plusieurs ressources.
    • Utilisateurs/Groups : Spécifiez les utilisateurs ou les groupes qui devraient avoir accès aux ressources Hive sélectionnées.
    • Autorisations : Choisissez les autorisations appropriées (lecture, écriture, création, suppression) qui devraient être accordées ou refusées pour les utilisateurs/groupes sélectionnés.
  5. Vérifiez et enregistrez la politique :

    • Vérifiez les détails de la politique pour vous assurer qu'ils correspondent à vos exigences de sécurité.
    • Cliquez sur "Add" pour enregistrer la politique.
graph LR A[Ranger Admin UI] --> B[Hive Service] B --> C[Create New Policy] C --> D[Policy Configuration] D --> E[Resources] D --> F[Users/Groups] D --> G[Permissions] E --> H[Databases, Tables, Columns] F --> I[Authorized Users/Groups] G --> J[Read, Write, Create, Drop]

En créant et en appliquant des politiques Ranger pour le Hive Metastore, vous pouvez vous assurer que seuls les utilisateurs et les applications autorisés peuvent accéder et manipuler les métadonnées stockées dans le Hive Metastore, améliorant ainsi la sécurité globale de votre écosystème Hadoop.

Résumé

Dans ce tutoriel axé sur Hadoop, vous avez appris à configurer Apache Ranger pour sécuriser votre Hive Metastore et contrôler l'accès à vos données. En configurant les politiques Ranger, vous pouvez vous assurer que seuls les utilisateurs et les applications autorisés peuvent interagir avec votre Hive Metastore, améliorant ainsi la sécurité globale de votre écosystème Hadoop.