当前位置：移动技术网 > IT编程>数据库>MongoDB > Redis 学习笔记（篇一）：字符串和链表

Redis 学习笔记（篇一）：字符串和链表

2019年06月15日 | 移动技术网IT编程 | 我要评论

允拓冷水机,圣元股票,重庆南极圈信息网

本次学习除了基本内容之外主要思考三个问题：why（为什么）、what（原理是什么）、which（同类中还有哪些类似的东西，相比有什么区别）。

由于我对 java 比较熟悉，并且 java 中也有字符串和链表。所以本篇暂拿 redis 中的字符串和链表与 java 进行对比。

字符串

先看几个问题：

redis 中有没有使用 c 语言的字符数组作为字符串？答案：没有
那么 c 语言的字符数组有着什么局限性以至于java和redis都重新定义了自己的字符串呢？
redis 定义的字符串结构是什么？java的呢？
java 和 redis 的字符串结构有什么区别？为什么会形成这样的区别？两者哪一个更好呢？

c 语言数组的局限性

取字符串长度不方便，c语言的字符数组没有存储字符串的长度，所以需要遍历。time（时间复杂度）：o(n)
不安全，两个字符数组进行拼接时可能会造成缓存区溢出，导致别的数据受损。
每次增删字符串都会导致重新分配或者回收内存，影响效率。
以\0判断是否结尾，只能存储文本数据。
比较两个字符串是否相等，需要循环比较每个字符，time:o(n)。

由于 c 语言的字符数组有着以上的局限性，所以 redis 和 java 都重新定义了自己的字符串结构。

redis 定义的字符串结构是什么？java 的呢？

redis 中的字符串是自己构建了一种叫做简单动态字符串（sds）的抽象类型标识的。它的具体结构如下：

struct sdshdr {
    //字符串长度
    int len;
    // buf中未使用的字节数
    int free;
    // 字节数组，用于保存字符串
    char buf[];
}

redis 的这个数据结构，很好的解决了 c 语言字符数组的第1、2、3、4点局限性。而且值得注意的是 sdshdr 中的 buf 数组，也是以“\0”结尾的，所以buf的总长度为：len + free + 1。那么为什么要浪费这一个字节呢？主要是想重用 c 语言对于字符串的一些函数，比如连接、输出等等。

这里有一个点需要注意一下，就是 redis 不会对存储的字符串进行编码，存储和获取都是直接通过二进制进行传输的，所以理论上来说只要客户端的编码和解码方式一样，是不会出现乱码的。这也是上面 buf 的注释里写字节数组的原因。

java 的字符串呢？则是直接把字符串搞成了一个常量。如下：

public final class string
    implements java.io.serializable, comparable<string>, charsequence {
    /** the value is used for character storage. */
    private final char value[];

    /** cache the hash code for the string */
    private int hash; // default to 0
    ......
}

java 的字符串也解决了c语言字符数组的第 1/2/3/4 点。

因为 java 中数组直接存储了长度，所以规避了 c 语言数组的第 1/4 点局限性。
因为 string 是常量，所以c语言字符数组的第 2/3 点局限性不存在。
为了解决第 5 点局限性，所以java中的字符串引入了 hashcode 的概念。
正是因为 hash 直接存储在字符串中，所以才把字符串设置成常量（否则，每改一次字符串的值，都需要重新计算 hashcode 的值，太浪费效率）。正因为字符串是常量，所以才有了 stringbuilder、stringbuffer 的可变字符串。。。。。。

现在我们再回去看一下 redis 中字符串的结构，有一个数组，有数组中存储数据的长度。想到了什么？java中 stringbuilder、stringbuffer、arraylist 是不是都是这个结构？他们的共同点呢？是不是都是可变的数组（ stringbuilder、stringbuffer 可以看成可变的字符数组）？

java 和 redis 的字符串比较

redis 字符串中的字符数组（buf）是以“\0”结尾的，java 中的不是。为什么呢？
因为 redis 的设计之初就是效率高、运行快的缓存。所以才会选择以 c 语言实现（因为c是所有结构化语言中运行最快的），并且和c的字符数组一样的结尾，以便可以直接使用c的函数而不重复造轮子。
java 的设计之初就是一门跨平台的语言，所以字符串的所有函数都是自己实现的，所以不需要额外浪费一个字节的空间。
redis 定义了一个 sds 的字符串，但也是基于 c 的字符数组。而java直接把c的数组都重新定义了（ c 的数组不能直接获得数组长度）。
关于字符串比较是否相等的问题：
java 中有 hashcode 的概念来提升字符串比较是否相等的速度。redis 中又是如何做的呢？比如 get key 时，如何定位的一个具体的 key，而得到的 value 呢？这个问题，暂时还不知道。

造成这些差异的原因，主要就是其定位不一样。redis 的定位是缓存、要求快。java 的定位是语言，最重要的是跨平台及扩展性。

链表

也同样看三个问题：

链表为什么产生？
原理是什么，和别的数据结构再来个对比。
和 java 的链表有什么不一样？

链表为什么产生？

链表的产生主要是因为数组的局限性。
比如：插入、删除慢。不能动态增加元素。

原理是什么

redis 的链表结构如下：

typedef struct listnode {
    struct listnode *prev; //前驱节点，如果是list的头结点，则prev指向null
    struct listnode *next;//后继节点，如果是list尾部结点，则next指向null
    void *value;            //万能指针，能够存放任何信息
} listnode;

typedef struct list {
    listnode *head;     //链表头结点指针
    listnode *tail;     //链表尾结点指针

    //下面的三个函数指针就像类中的成员函数一样
    void *(*dup)(void *ptr);    //复制链表节点保存的值
    void (*free)(void *ptr);    //释放链表节点保存的值
    int (*match)(void *ptr, void *key); //比较链表节点所保存的节点值和另一个输入的值是否相等
    unsigned long len;      //链表长度计数器
} list;

java 的链表结构如下：

public class linkedlist<e>
    extends abstractsequentiallist<e>
    implements list<e>, deque<e>, cloneable, java.io.serializable{
    transient int size = 0;

    /**
    * pointer to first node.
    * invariant: (first == null && last == null) ||
    *            (first.prev == null && first.item != null)
    */
    transient node<e> first;

    /**
    * pointer to last node.
    * invariant: (first == null && last == null) ||
    *            (last.next == null && last.item != null)
    */
    transient node<e> last;
    .......
}

redis 的链表和 java 的链表有什么不一样？

基本一致，都是双向不循环链表。

双向的优点就是可以向前遍历，也可以向后遍历。缺点就是每个节点都需要浪费一个指针去指向前一个节点。

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

MongoDB操作符中的$elemMatch问题

问题如果mongodb 数据库集合中仅存在一条记录{ "_id" : objectid("5e6b4ef546b5f44e5c5b276d"), "name... [阅读全文]
Redis 字符串 SDS

SDS 简单动态字符串。 SDS的结构： struct sdshdr{ int len;//记录BUF数组中已使用字节的数量，等于SDS所八寸字符串的... [阅读全文]
理解Redis持久化，RDB持久化和AOF持久化的不同处理方式

理解和掌握Redis的持久机制，对于Redis的日常开发和运维都有很大帮助，也是在大厂面试经常被问到的知识点。 ... [阅读全文]
Cassandra 简介

Cassandra是云原生和微服务化场景中最好的NoSQL数据库。我信了~ 1. Cassandra是什么高可用性和可扩展的分布式数据库 Apache... [阅读全文]
Redis 过期时间与内存管理

http://www.redis.cn/commands/expire.html http://www.redis.cn/topics/lru cach... [阅读全文]
Redis 两类持久化方式，快照和全量追加日志的不同处理方式

持久化 Redis 如同其他的存储组件一样，提供了两类持久化方式：快照，和全量追加日志。 RDB 快照在默认情况下， Redis 将数据库快照保存在... [阅读全文]
关于复制，你了解多少（附副本集常见任务教程）

MongoDB Manual (Version 4.2） Replication MongoDB中的副本集是一组维护相同数据集合的 mongod进程。副... [阅读全文]
Redis 到底是单线程还是多线程？我要吊打面试官！

最近在Java技术栈公众号发布的一篇文章，其中有一道题： Redis是多线程还是单线程？（回答单线程的请回吧，为什么请回，请往下看）好些粉丝在后台问我... [阅读全文]
Redis的消息发布与订阅

Redis 作为一个publish/subscribe server，起到了消息路由的功能。订阅者可以通过subscribe和psubscribe命令向... [阅读全文]
Redis系列(六)：设置/移除键的过期时间

本篇博客是Redis系列的第6篇，主要讲解以下内容： 1. 数据库数量 2. 切换目标数据库 3. 设置键的过期时间 4. 移除键的过期时间本系列的前... [阅读全文]