当前位置: 移动技术网 > IT编程>数据库>Redis > Redis教程(十一):虚拟内存介绍

Redis教程(十一):虚拟内存介绍

2017年12月08日  | 移动技术网IT编程  | 我要评论

一、简介:

    和大多nosql数据库一样,redis同样遵循了key/value数据存储模型。在有些情况下,redis会将keys/values保存在内存中以提高数据查询和数据修改的效率,然而这样的做法并非总是很好的选择。鉴于此,我们可以将之进一步优化,即尽量在内存中只保留keys的数据,这样可以保证数据检索的效率,而values数据在很少使用的时候则可以被换出到磁盘。
    在实际的应用中,大约只有10%的keys属于相对比较常用的键,这样redis就可以通过虚存将其余不常用的keys和values换出到磁盘上,而一旦这些被换出的keys或values需要被读取时,redis则将其再次读回到主内存中。

二、应用场景:

    对于大多数数据库而言,最为理想的运行方式就是将所有的数据都加载到内存中,而之后的查询操作则可以完全基于内存数据完成。然而在现实中这样的场景却并不普遍,更多的情况则是只有部分数据可以被加载到内存中。
    在redis中,有一个非常重要的概念,即keys一般不会被交换,所以如果你的数据库中有大量的keys,其中每个key仅仅关联很小的value,那么这种场景就不是非常适合使用虚拟内存。如果恰恰相反,数据库中只是包含少量的keys,而每一个key所关联的value却非常大,那么这种场景对于使用虚存就再合适不过了。
    在实际的应用中,为了能让虚存更为充分的发挥作用以帮助我们提高系统的运行效率,我们可以将带有很多较小值的keys合并为带有少量较大值的keys。其中最主要的方法就是将原有的key/value模式改为基于hash的模式,这样可以让很多原来的keys成为hash中的属性。

三、配置:

  1). 在配置文件中添加以下配置项,以使当前redis服务器在启动时打开虚存功能。
    vm-enabled yes
   
    2). 在配置文件中设定redis最大可用的虚存字节数。如果内存中的数据大于该值,则有部分对象被换出到磁盘中,其中被换出对象所占用内存将被释放,直到已用内存小于该值时才停止换出。
 

复制代码 代码如下:

    vm-max-memory (bytes)
 

    redis的交换规则是尽量考虑"最老"的数据,即最长时间没有使用的数据将被换出。如果两个对象的age相同,那么value较大的数据将先被换出。需要注意的是,redis不会将keys交换到磁盘,因此如果仅仅keys的数据就已经填满了整个虚存,那么这种数据模型将不适合使用虚存机制,或者是将该值设置的更大,以容纳整个keys的数据。在实际的应用,如果考虑使用redis虚拟内存,我们应尽可能的分配更多的内存交给redis使用,以避免频繁的换入换出。
   
    3). 在配置文件中设定页的数量及每一页所占用的字节数。为了将内存中的数据传送到磁盘上,我们需要使用交换文件。这些文件与数据持久性无关,redis会在退出前会将它们全部删除。由于对交换文件的访问方式大多为随机访问,因此建议将交换文件存储在固态磁盘上,这样可以大大提高系统的运行效率。
 
复制代码 代码如下:

    vm-pages 134217728
    vm-page-size 32   
 

    在上面的配置中,redis将交换文件划分为vm-pages个页,其中每个页所占用的字节为vm-page-size,那么redis最终可用的交换文件大小为:vm-pages * vm-page-size。由于一个value可以存放在一个或多个页上,但是一个页不能持有多个value,鉴于此,我们在设置vm-page-size时需要充分考虑redis的该特征。
 
    4). 在redis的配置文件中有一个非常重要的配置参数,即:
 
复制代码 代码如下:

    vm-max-threads 4
 

    该参数表示redis在对交换文件执行io操作时所应用的最大线程数量。通常而言,我们推荐该值等于主机的cpu cores。如果将该值设置为0,那么redis在与交换文件进行io交互时,将以同步的方式执行此操作。
    对于redis而言,如果操作交换文件是以同步的方式进行,那么当某一客户端正在访问交换文件中的数据时,其它客户端如果再试图访问交换文件中的数据,该客户端的请求就将被挂起,直到之前的操作结束为止。特别是在相对较慢或较忙的磁盘上读取较大的数据值时,这种阻塞所带来的影响就更为突兀了。然而同步操作也并非一无是处,事实上,从全局执行效率视角来看,同步方式要好于异步方式,毕竟同步方式节省了线程切换、线程间同步,以及线程拉起等操作产生的额外开销。特别是当大部分频繁使用的数据都可以直接从主内存中读取时,同步方式的表现将更为优异。
    如果你的现实应用恰恰相反,即有大量的换入换出操作,同时你的系统又有很多的cores,有鉴于此,你又不希望客户端在访问交换文件之前不得不阻塞一小段时间,如果确实是这样,我想异步方式可能更适合于你的系统。
    至于最终选用哪种配置方式,最好的答案将来自于不断的实验和调优。

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网