当前位置：移动技术网 > IT编程>数据库>Redis > Redis实现唯一计数的3种方法分享

Redis实现唯一计数的3种方法分享

2017年12月08日 | 移动技术网IT编程 | 我要评论

唯一计数是网站系统中十分常见的一个功能特性，例如网站需要统计每天访问的人数 unique visitor （也就是 uv）。计数问题很常见，但解决起来可能十分复杂：一是需要计数的量可能很大，比如大型的站点每天有数百万的人访问，数据量相当大；二是通常还希望扩展计数的维度，比如除了需要每天的 uv，还想知道每周或每月的 uv，这样导致计算十分复杂。

在关系数据库存储的系统里，实现唯一计数的方法就是 select count(distinct <item_id>)，它十分简单，但是如果数据量很大，这个语句执行是很慢的。用关系数据库另外一个问题是插入数据性能也不高。

redis 解决这类计数问题得心应手，相比关系数据库速度更快，消耗资源更少，甚至提供了 3 种不同的方法。

1.基于 set

redis 的 set 用于保存唯一的数据集合，通过它可以快速判断某一个元素是否存在于集合中，也可以快速计算某一个集合的元素个数，另外和可以合并集合到一个新的集合中。涉及的命令如下：

复制代码代码如下:

sismember key member  # 判断 member 是否存在

sadd key member  # 往集合中加入 member

scard key   # 获取集合元素个数 

基于 set 的方法简单有效，计数精确，适用面广，易于理解，它的缺点是消耗资源比较大（当然比起关系数据库是少很多的），如果元素个数很大（比如上亿的计数），消耗内存很恐怖。

2.基于 bit

redis 的 bit 可以用于实现比 set 内存高度压缩的计数，它通过一个 bit 1 或 0 来存储某个元素是否存在信息。例如网站唯一访客计数，可以把 user_id 作为 bit 的偏移量 offset，设置为 1 表示有访问，使用 1 mb的空间就可以存放 800 多万用户的一天访问计数情况。涉及的命令如下：

复制代码代码如下:

setbit key offset value  # 设置位信息

getbit key offset        # 获取位信息

bitcount key [start end] # 计数

bitop operation destkey key [key ...]  # 位图合并

基于 bit 的方法比起 set 空间消耗小得多，但是它要求元素能否简单映射为位偏移，适用面窄了不少，另外它消耗的空间取决于最大偏移量，和计数值无关，如果最大偏移量很大，消耗内存也相当可观。

3.基于 hyperloglog

实现超大数据量精确的唯一计数都是比较困难的，但是如果只是近似的话，计算科学里有很多高效的算法，其中 hyperloglog counting 就是其中非常著名的算法，它可以仅仅使用 12 k左右的内存，实现上亿的唯一计数，而且误差控制在百分之一左右。涉及的命令如下：

复制代码代码如下:

pfadd key element [element ...]  # 加入元素

pfcount key [key ...]   # 计数

这种计数方法真的很神奇，我也没有彻底弄明白，有兴趣可以深入研究相关文章。

redis 提供的这三种唯一计数方式各有优劣，可以充分满足不同情况下的计数要求。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

高并发高可用复杂系统中的缓存架构(四) redis架构基础

图解分析 redis 的 RDB 和 AOF 两种持久化机制的工作原理我们已经知道对于一个企业级的 redis ... [阅读全文]
redis相关操作命令适合5.0及以后版本

1.在创建redis集群的时候不要手动创建主从节点的关系，而是在创建集群的时候，随机指定的，另外，如果节点有密码... [阅读全文]
系统性能提升优先法宝 | 缓存应用实践

文章概要缓存是系统性能提升优先法宝，在互联网应用系统中，屡试不爽。网上有很多资料介绍缓存理论及使用策略，本文就不... [阅读全文]
redis 分布算法

hash算法hash算法最大的一个问题是，比如三台服务，一台挂了(这时就丢了三分之一数据)，原来%3取值的，要变... [阅读全文]
IOT项目中Redis与kafka做消息队列比较：Redis逐渐淘汰

鉴于本人在IOT项目中使用消息队列缓存设备端的大量数据，需要分析瞬间消息数据缓冲，小型项目可以使用redis,而... [阅读全文]
REDIS集群基础知识总结

REDIS集群单机单点故障、瓶颈；多个节点负载；集群主从复制定义Replication镜像：增删改&am... [阅读全文]
高并发高可用复杂系统中的缓存架构(三) 能够支撑高并发 + 高可用 + 海量数据 + 备份恢复的 redis 的重要性

商品详情页的架构实现缓存架构的第一块儿，要掌握的很好的，就是 redis 架构高并发、高可用、海量数据、备份、随... [阅读全文]
redis系列（13）-- 高级话题之主从复制--读写分离--容灾处理

前言：废话不说，上手就干redis的持久化功能保证了即使在服务器重启的情况下也不会丢失（或少量丢失）数据，但是由... [阅读全文]
Redis介绍与安装

Redis是一种基于键值对（key-value）数据库，其中value可以为string、hash、list、s... [阅读全文]
Redis---B站学习---redis分布式数据库CAP原理

Redis—B站学习—redis分布式数据库CAP原理在分布式数据库中CAP原理CAP+BASE传统的ACID分... [阅读全文]

网友评论


验证码：

Redis实现唯一计数的3种方法分享

2017年12月08日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论