当前位置：移动技术网 > IT编程>数据库>MongoDB > 缓存的应用场景以及要注意的问题

缓存的应用场景以及要注意的问题

2019年04月17日 | 移动技术网IT编程 | 我要评论

什么是缓存(cache)：

　　在项目中没有必要每次请求都查询数据库的情况就可以使用缓存，让每次请求先查询缓存，如果命中，就直接返回缓存结果，如果没有命中，就查询数据库，并将查询结果放入缓存，下次请求时查询缓存命中，直接返回结果，就不用再次查询数据库。

缓存的作用？

　　缓和较慢存储的高频请求，缓解数据库压力，提升响应速率。

为什么缓存可以提高响应速度？

　　因为缓存时基于内存的存储的，内存的读写速率时普通ssd硬盘的至少十倍，更何况机械硬盘了：看对比图

缓存介质？

　　web项目中常用的缓存是memcached和redis，它们都支持分布式存储

缓存一定能给项目响应速率带来较大提升吗?

　　答案是不见得，要根据项目实际情况分析，有没有使用缓存的不要。在考虑使用缓存前，不妨先问问自己：

　　1.　项目的读写操作比例为多少，如果是写多读少，那缓存真的比一定能帮助你，此时不妨考虑数据库分库分表，然后做mysql的分布式集群，或者简单直接，将硬盘全部替换为ssd(如果你的公司财大气粗)，反之，以读为主的项目就比较适合加缓存了

　　2. 项目的访问频率高不高（用户多不多）？如果用户区区几千人或几万人，全然没有必要使用缓存，这点访问量经过网络后几乎不会造成并发，即使偶出现几万的并发，mysql也是扛得住的，强行使用缓存反而会增加代码复杂度，甚至不容易维护，得不偿失。

　　3. 数据是否要求强一致性？如果项目涉及到金钱或者重要数据，且数据频繁发生变化，不允许存在一点差异，那是否使用缓存就要慎重慎重再慎重！因为缓存适用的是对数据一致性不是特别高的项目，如果使用，需要对缓存的设计有很好的方案，非常考验技术功底

说了这么多，进入正题吧，我们通过代码来模拟一下缓存的使用：

　　redis版本：

 1 #!/usr/bin/python
 2 # -*- coding: utf-8 -*-
 3 import functools
 4 import redis
 5 import time
 6 import json
 7 """
 8 使用redis做缓存，这里模拟一个web接口缓存的例子
 9 """
10 
11 # 这里使用redis连接池，管理redisservice的所有连接，避免每次创建关闭连接的开销
12 pool = redis.connectionpool(host='127.0.0.1', port=6379)
13 redis_cli = redis.redis(connection_pool=pool)
14 
15 def redis_cache(func):
16     @functools.wraps(func)        # 为了保留原函数的属性，因为被装饰的函数对外暴露的是装饰器的属性
17     def wrapper(*args,**kargs):
18         start_time = time.time()
19         _key = 'function-name:{},args:{},kargs:{}'.format(func.__name__,args,kargs)     #定义key的形式：函数名加与参数组成唯一的key
20         result = redis_cli.get(_key)
21         if result:      # redis查找到对应的key，直接返回结果
22             result = json.loads(result)
23             print(type(result))
24             print('redis find:{},result:{}'.format(_key,result))
25         else:            # redis没有查找到对应key，查询执行函数，查询mysql
26             print('redis not find:{}'.format(_key))
27             result = func(*args,**kargs)
28             redis_cli.setex(_key,json.dumps(result),5)     #将mysql结果写入redis,并设置过期时间 单位s
29         print("final result:{}".format(result))
30         end_time = time.time()-start_time
31         print("total time of this query:{}".format(end_time))
32         return result
33     return wrapper
34 
35 
36 @redis_cache
37 def mysql_dispose(name,age):
38     time.sleep(2)
39     result = {'name:':name,'age':age}
40     print('mysql-result:{}'.format(result))
41     return(result)
42 
43 
44 if __name__ == '__main__':
45     mysql_dispose('zz3',45)
46 
47 
48 out-put>>>:
49 第一次执行：
50 　　　　redis not find:function-name:mysql_dispose,args:('zz3', 45),kargs:{}
51 　　　　mysql-result:{'name:': 'zz3', 'age': 45}
52 　　　　final result:{'name:': 'zz3', 'age': 45}
53        total time of this query:2.0049448013305664
54 
55 第二次执行（距第一次5秒内执行）：
56 　　　　<class 'dict'>
57 　　　　redis find:function-name:mysql_dispose,args:('zz3', 45),kargs:{},result:{'name:': 'zz3', 'age': 45}
58 　　　　total time of this query:0.005013942718505859
59 
60 第三次执行（5秒后）因为redis key过期被删除，所以无法命中，请求会再次查询数据库，然后添加缓存：　
61 　　　　redis not find:function-name:mysql_dispose,args:('zz3', 45),kargs:{}
62 　　　　mysql-result:{'name:': 'zz3', 'age': 45}
63 　　　　final result:{'name:': 'zz3', 'age': 45}
64        total time of this query:2.0038458017378002

不难看出，原本需要2秒才能完成的数据库查询动作，再有了redis缓存后可以直接返回结果，提高了响应速率

　　memcached版本（与上面代码大同小异，但是会有坑,注意红色标记部分）

#!/usr/bin/python
# -*- coding: utf-8 -*-
import functools
#要使用这个库，需要先安装：pip install python-memcached
import memcache
import hashlib
import time
import json
"""
使用memcache做缓存，这里模拟一个web接口缓存的例子
"""

# 连接到memcached服务器
conn = memcache.client(['localhost:11211'])

def redis_cache(func):
    @functools.wraps(func)        # 为了保留原函数的属性，因为被装饰的函数对外暴露的是装饰器的属性
    def wrapper(*args,**kargs):
        start_time = time.time()
        _key = 'function-name:{},args:{},kargs:{}'.format(func.__name__,args,kargs)     #定义key的形式
        # _key = 'ddd'
        # hash_obj = hashlib.md5()
        # hash_obj.update(_key.encode(encoding='utf-8'))
        # key_hash = hash_obj.hexdigest()
        result = conn.get(_key)
        if result:      # memcached查找到对应的key，直接返回结果
            result = json.loads(result)
            print(type(result))
            print('memcached find:{},result:{}'.format(_key,result))
        else:            # memcached没有查找到对应key，查询执行函数，查询mysql
            print('memcached not find:{}'.format(_key))
            result = func(*args,**kargs)
            conn.set(_key,json.dumps(result),5)     #将mysql结果写入memcached,并设置过期时间 单位s
        print("final result:{}".format(result))
        end_time = time.time()-start_time
        print("total time of this query:{}".format(end_time))
        return result
    return wrapper


@redis_cache
def mysql_dispose(name,age):
    time.sleep(2)
    result = {'name:':name,'age':age}
    print('mysql-result:{}'.format(result))
    return(result)


if __name__ == '__main__':
    mysql_dispose('zz3',45)

当我将redis换为memcache后，运行发现居然报错了！：

traceback (most recent call last):
  file "memcache_cache.py", line 50, in <module>
    mysql_dispose('zz3',45)
  file "memcache_cache.py", line 25, in wrapper
    result = conn.get(_key)
  file "c:\users\sys_syscafhost\appdata\local\programs\python\python36\lib\site-packages\memcache.py", line 888, in get
    return self._get('get', key)
  file "c:\users\sys_syscafhost\appdata\local\programs\python\python36\lib\site-packages\memcache.py", line 837, in _get

    self.check_key(key)
  file "c:\users\sys_syscafhost\appdata\local\programs\python\python36\lib\site-packages\memcache.py", line 1053, in check_key
    "control characters not allowed")
memcache.memcachedkeycharactererror: control characters not allowed

说明我们的key有空格字符，what？redis版本中一点问题没有，这里却说不允许，先打印出来看看：

　　_key : function-name:mysql_dispose,args:('zz3', 45),kargs:{}

原来是'zz3',和45之间有空格,'所以大家要注意，memcached key不能包含空格，但是这是python args自动解析填写的，怎么办？

算了，一种是对_key处理，去掉空格，但是感觉麻烦且别扭，索性取_keyde md5的结果，这里用到标准库：hashlib

　　代码修改后为：

#!/usr/bin/python
# -*- coding: utf-8 -*-
import functools
#要使用这个库，需要先安装：pip install python-memcached
import memcache
import hashlib
import time
import json
"""
使用memcache做缓存，这里模拟一个web接口缓存的例子
"""

# 连接到memcached服务器
conn = memcache.client(['localhost:11211'])

def redis_cache(func):
    @functools.wraps(func)        # 为了保留原函数的属性，因为被装饰的函数对外暴露的是装饰器的属性
    def wrapper(*args,**kargs):
        start_time = time.time()
        key = 'function-name:{},args:{},kargs:{}'.format(func.__name__,args,kargs)     #定义key的形式
        hash_obj = hashlib.md5()
        hash_obj.update(key.encode(encoding='utf-8'))
        _key_hash = hash_obj.hexdigest()
        result = conn.get(_key_hash)
        if result:      # memcached查找到对应的key，直接返回结果
            result = json.loads(result)
            print(type(result))
            print('memcached find:{},result:{}'.format(_key_hash,result))
        else:            # memcached没有查找到对应key，查询执行函数，查询mysql
            print('memcached not find:{}'.format(_key_hash))
            result = func(*args,**kargs)
            conn.set(_key_hash,json.dumps(result),5)     #将mysql结果写入memcached,并设置过期时间 单位s
        print("final result:{}".format(result))
        end_time = time.time()-start_time
        print("total time of this query:{}".format(end_time))
        return result
    return wrapper


@redis_cache
def mysql_dispose(name,age):
    time.sleep(2)
    result = {'name:':name,'age':age}
    print('mysql-result:{}'.format(result))
    return(result)


if __name__ == '__main__':
    mysql_dispose('zz3',45)


#这下正常运行了，output>>>
第一次运行：

　　memcached not find:1477b8c668df1f570293f4c374963638
　　mysql-result:{'name:': 'zz3', 'age': 45}
　　final result:{'name:': 'zz3', 'age': 45}
　　total time of this query:2.005075693130493

第二次运行（5s内）：

　　<class 'dict'>
　　memcached find:1477b8c668df1f570293f4c374963638,result:{'name:': 'zz3', 'age': 45}
　　final result:{'name:': 'zz3', 'age': 45}
　　total time of this query:0.004010915756225586

　第三次（5s后）：

　　memcached not find:1477b8c668df1f570293f4c374963638
　　mysql-result:{'name:': 'zz3', 'age': 45}
　　final result:{'name:': 'zz3', 'age': 45}
　　total time of this query:2.015402317047119

接下来就是项目中使用缓存不得不考虑的问题了，也是缓存的三大问题：

　　1.缓存穿透，

2.缓存过期（击穿），

　　3.缓存雪崩

　　这里用一张表（students）做描述：

　　　　s_id, s_name, s_birth, s_sex

　　　　01赵雷1990-01-01男

　　　　02钱电1990-12-21男

　　　　03孙风1990-05-20男

　　　　04李云1990-08-06男

　　　　05周梅1991-12-01女

　　　　06吴兰1992-03-01女

　　　　07郑竹1989-07-01女

　　　　08王菊1990-01-20女

　 缓存穿透：

　　　　也就是指查询目标不在缓存，也不在数据库中存在：比如：某个用户请求查询name=‘夏雨’的记录：

　　　　先会在redis cache中查找，没有值，再查数据库中也找不到结果，这就造成了数据会穿透redis cache而每次命中mysql

　　　　　试想：如果有用户恶意攻击怎么办？故意发起10w次并发请求怎么办？所有的请求都会穿过redis cache而次次命中mysql，对mysql造成了非常大的压力，甚至可能会出现宕机.

　　　　　怎么办呢？一般来说，两种处理方式：

　　　　　　1. redis cache缓存空数据，也就是，即使mysql未查询到结果，也将这个请求与参数保存在redis,key=xxxxxxnameis夏雨，vaule=none，下次同样的请求直接redis返回none，不再查询数据库

　　　　　　这样的方法比较挫，因为虽然省事，但是势必会在缓存中增加很多无用的信息，这种时间最好设置key的过期时间，使无用的key在一段短时间内自动删除，当然，这种方法适用于无效key较少的情况使用

　　　　　　2. 使用bloomfilter（布隆过滤器）

　　　　　　　　需要在redis cache之前再加一层，

　　　　　　　　当name=‘夏雨’的请求再次要求查询时，先查询bloomfilter中key是否存在，不存在就直接返回none，存在，再走redis查询

　　缓存过期：

　　　　我们在设置缓存的key--value时，会设置一个过期时间，再有效期内，大量的查询都会被redis拦截处理，并返回结果，但是，当大量请求持续查询redis某个key时比如name=‘赵雷’，正好redis的这个key到了过期时间，被自动删除了，那redis查不到了，大量的查询请求就会到mysql这边，而mysql给第一次请求查询时用了2秒才返回，并写入redis cache，那这2秒之内，redis还未重新更新数据，剩下的大量查询还时指向了mysql，造成mysql的io阻塞，数据库可能宕机.，且这些查询mysql后会重复写redis。

　　解决方法：

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

MongoDB常用数据库命令大全

一、mongodb 数据库常用操作命令1、help查看命令提示helpdb.help();db.yourcoll.help();2、切换/创建数据库use ra... [阅读全文]
28个MongoDB经典面试题详解

mongodb是目前最好的面向文档的免费开源nosql数据库。如果你正准备参加mongodb nosql数据库的技术面试，你最好看看下面的mongodb nos... [阅读全文]
MongoDB 数据库的命名、设计规范详解

mongodb 数据库的命名和设计也有一套规范。只不过，由于用的人不多，目前在业界还没有形成权威的共识，今天根据我个人平时的一些经验，总结了一些规范第一部分，我... [阅读全文]
MongoDB中数据的替换方法实现类Replace()函数功能详解

近日接到一个开发需求，因业务调整，需要dba协助，将mongodb数据库中某集合的进行替换。例如我们需要将集合a中b字段中，有关《美好》的字符替换为《非常美好... [阅读全文]
解决MongoDB占用内存过大频繁死机的方法详解

从mongodb 3.4开始，默认的wiredtiger内部缓存大小是以下两者中的较大者：50％（ram-1 gb），或 256 mb例如，在总共有4gb ra... [阅读全文]
在 Fedora 上安装 MongoDB 服务器的方法教程

mongo（来自 “humongous” —— 巨大的）是一个高性能、开源、无模式的、面向文档的数据库，它是最受欢迎的 nosql 数据库之一。它使用 json... [阅读全文]
mongodb driver使用代码详解

mongodb 是一个基于分布式文件存储的数据库。由 c++ 语言编写。旨在为 web 应用提供可扩展的高性能数据存储解决方案。mongodb 是一个介于关系数... [阅读全文]
MongoDB操作符中的$elemMatch问题

问题如果mongodb 数据库集合中仅存在一条记录{ "_id" : objectid("5e6b4ef546b5f44e5c5b276d"), "name... [阅读全文]
Redis 字符串 SDS

SDS 简单动态字符串。 SDS的结构： struct sdshdr{ int len;//记录BUF数组中已使用字节的数量，等于SDS所八寸字符串的... [阅读全文]
理解Redis持久化，RDB持久化和AOF持久化的不同处理方式

理解和掌握Redis的持久机制，对于Redis的日常开发和运维都有很大帮助，也是在大厂面试经常被问到的知识点。 ... [阅读全文]

网友评论


验证码：

缓存的应用场景以及要注意的问题

2019年04月17日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论