菜鸟笔记
提升您的技术认知

Redis HyperLogLog

阅读 : 873

HyperLogLog

Redis HyperLogLog是一种使用随机算法的算法,目的是仅使用一个常量和少量的内存就可以估算一组集合中唯一元素的数量。HyperLogLog可以很好地近似集合的基数,即使使用很少的内存(每个key大约12 KB),标准误差为0.81%。可以计数的项目数没有限制,除非您要处理2 64个项目。

什么是基数?

比如数据集 {1, 3, 5, 7, 5, 7, 8}, 那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。 基数估计就是在误差可接受的范围内,快速计算基数。

例如:以下示例说明了Redis HyperLogLog的工作方式。

redis 127.0.0.1:6379> PFADD tutorials "redis"  
1) (integer) 1  
redis 127.0.0.1:6379> PFADD tutorials "mongodb"  
1) (integer) 1  
redis 127.0.0.1:6379> PFADD tutorials "mysql"  
1) (integer) 1  
redis 127.0.0.1:6379> PFCOUNT tutorials  
(integer) 3 

Redis HyperLogLog命令

下表列出了与Redis HyperLogLog相关的一些基本命令。

命令 描述
PFADD key element [element ...] 将指定的元素添加到指定的HyperLogLog。
PFCOUNT key [key ...] 返回由HyperLogLog在键处观察到的集合的近似基数。
PFMERGE destkey sourcekey [sourcekey ...] 将N个不同的HyperLogLog合并为一个。