redis五大数据类型实现原理

0.redisObject

1
2
3
4
5
6
7
8
9
10
11
12
13
typedef struct redisObject{
//类型
unsigned type:4;
//编码
unsigned encoding:4;
//指向底层数据结构的指针
void *ptr;
//引用计数
int refcount;
//记录最后一次被程序访问的时间
unsigned lru:22;

}robj

redis的key都是字符串类型,value是redis的包装类型,以下五种类型表现形式都是一个redisObject。

  • type类型来区分是哪种具体类型。
    type key
  • encoding用来表明该类型使用哪种编码,而每种类型至少使用了两种编码。
    OBJECT ENCODING key

1.字符串

a)编码类型
    int,embstr,raw三种编码
    int保存可用long表示的无符号整数值
    embstr表示长度小于44的短字符串
    raw表示长度大于44的长字符串

    embstr和raw的区别:
      1.embstr由于是短字符串,redis做了优化,只分配一次空间redisObject和sds是连续的,而raw是分开的。添加和删除时候embstr都比raw少操作一次空间。
b)编码转换
   1.embstr由于没有提供修改方法,需要升级为raw才能修改,修改完即使小于44字节还是会变成raw编码。
   2.如果是float类型保存也是按字符串保存的,当需要时候才转换为float。
   3.当int编码保存的不再是整数,或超过long的长度就会转换为raw编码。

2.列表

存放简单字符串sds的链表结构

a)编码类型
    压缩链表(ziplist)和双端链表(linklist)
b)编码转换
    当满足字符串长度小于64字节并且字符串数量小于512个俩个条件时,使用ziplist,否则使用linklist。

3.哈希

值是字符串,value是键值对

a)编码类型
    压缩链表(ziplist)和哈希表(hashtable)
    哈希表底层使用字典类型结构
b)编码转换
    和列表一样,当满足字符串长度小于64字节并且字符串数量小于512个俩个条件时,使用ziplist,否则使用hashtable。

4.集合
不重复且无序的列表

a)编码类型
    intset和哈希表(hashtable)
    哈希表存放的只有key,value都指向null.类似与java中的HashSet,使用HashMap实现,value都是null。
b)编码转换
    当存放的所有元素都是整数且不超过512个使用intset,否则使用哈希表。

5.有序集合
不重复且有序的列表

a)编码类型
    压缩链表(ziplist)和 (字典+跳表)
    当使用压缩链表实现时,值和分数是相邻存放,前面是值,后面跟的分数,值之间是从小到大有序排列。
    当使用字典+跳表实现时,执行精确查找使用字典,范围查找使用跳表,他们二者共享同一份数据。
b)编码转换
    当存放的元素长度小于64且个数小于128时使用压缩链表,否则使用字典+跳表实现。