Introduction
Dans ce laboratoire, vous explorerez les opérations Redis HyperLogLog. HyperLogLog est une structure de données puissante dans Redis qui vous permet d'estimer le nombre d'éléments uniques dans un ensemble, même avec de très grands ensembles de données. C'est ce qu'on appelle l'estimation de cardinalité (cardinality estimation). Vous apprendrez à utiliser PFADD pour ajouter des éléments, PFCOUNT pour compter les éléments uniques et PFMERGE pour fusionner des HyperLogLogs. Ce laboratoire vous fournira une expérience pratique du suivi efficace des utilisateurs uniques.
Ajout d'éléments avec PFADD
Dans cette étape, vous apprendrez à ajouter des éléments à un HyperLogLog en utilisant la commande PFADD. Si l'HyperLogLog n'existe pas, PFADD le créera automatiquement.
Understanding PFADD
La commande PFADD ajoute un ou plusieurs éléments à un HyperLogLog.
Syntax:
PFADD key element [element ...]
key: Le nom de l'HyperLogLog.element: Le(s) élément(s) à ajouter à l'HyperLogLog.
Example:
Tout d'abord, connectez-vous au serveur Redis en utilisant la commande redis-cli dans votre terminal :
redis-cli
Maintenant, créons un HyperLogLog nommé myhyperloglog et ajoutons-y quelques éléments.
PFADD myhyperloglog item1 item2 item3
Vous devriez voir la sortie suivante :
(integer) 1
La réponse (integer) 1 indique qu'au moins un élément a été ajouté à l'HyperLogLog. Cela ne signifie pas nécessairement que tous les éléments étaient nouveaux (uniques).
N'oubliez pas de quitter redis-cli après avoir exécuté la commande :
exit
Hands-on Practice:
- Connectez-vous au serveur Redis en utilisant
redis-cli. - Créez un HyperLogLog nommé
users. - Ajoutez les ID d'utilisateur suivants à l'HyperLogLog
users:user1,user2,user3,user4,user5. - Quittez
redis-cli.
PFADD users user1 user2 user3 user4 user5
exit
Dans l'étape suivante, vous apprendrez à estimer le nombre d'utilisateurs uniques à l'aide de la commande PFCOUNT.
Compter les éléments uniques avec PFCOUNT
Dans cette étape, vous apprendrez à utiliser la commande PFCOUNT pour estimer le nombre d'éléments uniques dans un HyperLogLog.
Understanding PFCOUNT
La commande PFCOUNT renvoie une approximation de la cardinalité (nombre d'éléments uniques) de l'ensemble observé par l'HyperLogLog. Il est important de se rappeler que HyperLogLog fournit une estimation, et non un compte exact.
Syntax:
PFCOUNT key
key: Le nom de l'HyperLogLog.
Example:
En continuant à partir de l'étape précédente, estimons le nombre d'utilisateurs uniques dans l'HyperLogLog users.
Connectez-vous au serveur Redis en utilisant redis-cli :
redis-cli
Maintenant, utilisez la commande PFCOUNT :
PFCOUNT users
Vous devriez voir une sortie similaire à celle-ci :
(integer) 5
La sortie (integer) 5 indique que l'HyperLogLog estime qu'il y a approximativement 5 utilisateurs uniques dans l'HyperLogLog users.
Quittez redis-cli :
exit
Hands-on Practice:
- Connectez-vous au serveur Redis en utilisant
redis-cli. - Utilisez la commande
PFCOUNTpour estimer le nombre d'utilisateurs uniques dans l'HyperLogLogusers. - Quittez
redis-cli.
PFCOUNT users
exit
Maintenant, ajoutons plus d'utilisateurs à l'HyperLogLog users, y compris un doublon, puis recomptons.
redis-cli
PFADD users user3 user6 user7
PFCOUNT users
exit
Dans l'étape suivante, vous apprendrez à fusionner des HyperLogLogs.
Fusionner des HyperLogLogs avec PFMERGE
Dans cette étape, vous apprendrez à fusionner plusieurs HyperLogLogs en un seul HyperLogLog en utilisant la commande PFMERGE. Ceci est utile lorsque vous avez des données réparties sur plusieurs HyperLogLogs et que vous souhaitez obtenir une estimation du nombre total d'éléments uniques.
Understanding PFMERGE
La commande PFMERGE fusionne plusieurs HyperLogLogs dans un HyperLogLog de destination. L'HyperLogLog de destination contiendra l'union des éléments de tous les HyperLogLogs sources.
Syntax:
PFMERGE destkey sourcekey [sourcekey ...]
destkey: Le nom de l'HyperLogLog de destination (où le résultat fusionné sera stocké). S'il n'existe pas, il sera créé. S'il existe, il sera écrasé.sourcekey: Le(s) nom(s) des HyperLogLogs sources à fusionner.
Example:
Créons un nouvel HyperLogLog appelé new_users et ajoutons-y quelques utilisateurs.
redis-cli
PFADD new_users user8 user9 user10
exit
Maintenant, fusionnons les HyperLogLogs users et new_users dans un nouvel HyperLogLog appelé all_users.
redis-cli
PFMERGE all_users users new_users
Vous devriez voir la sortie suivante :
OK
La réponse OK indique que l'opération de fusion a réussi.
Maintenant, estimons le nombre d'utilisateurs uniques dans l'HyperLogLog all_users :
PFCOUNT all_users
exit
Vous devriez voir une sortie similaire à celle-ci :
(integer) 7
La sortie (integer) 7 indique que l'HyperLogLog estime qu'il y a approximativement 7 utilisateurs uniques dans l'HyperLogLog fusionné all_users.
Hands-on Practice:
- Connectez-vous au serveur Redis en utilisant
redis-cli. - Utilisez la commande
PFMERGEpour fusionner les HyperLogLogsusersetnew_usersdans un nouvel HyperLogLog appeléall_users. - Utilisez la commande
PFCOUNTpour estimer le nombre d'utilisateurs uniques dans l'HyperLogLogall_users. - Quittez
redis-cli.
PFMERGE all_users users new_users
PFCOUNT all_users
exit
Ceci termine le labo sur l'utilisation des HyperLogLogs dans Redis. Vous avez appris à ajouter des éléments, à compter les éléments uniques et à fusionner des HyperLogLogs.
Résumé
Dans ce labo, vous avez appris à utiliser la commande PFADD dans Redis pour ajouter des éléments à une structure de données HyperLogLog. La commande PFADD met efficacement à jour l'HyperLogLog pour estimer la cardinalité d'un ensemble, sans stocker les éléments eux-mêmes. Vous avez également appris à utiliser PFCOUNT pour estimer la cardinalité d'un HyperLogLog et PFMERGE pour fusionner plusieurs HyperLogLogs en un seul. Cela fournit un moyen puissant et efficace de suivre les éléments uniques dans de grands ensembles de données (datasets).


