首页 > 资讯 > 数据库 >redis中的数据结构和编码详解

328

分享到

redis中的数据结构和编码详解

2024-04-02 19:04:59 328人浏览薄情痞子

摘要

redis中的数据结构和编码：背景： 1>Redis在内部使用red

redis中的数据结构和编码：

背景：

1>Redis在内部使用redisObject结构体来定义存储的值对象。
2>每种类型都有至少两种内部编码，Redis会根据当前值的类型和长度来决定使用哪种编码实现。
3>编码类型转换在Redis写入数据时自动完成，这个转换过程是不可逆的，转换规则只能从小内存编码向大内存编码转换。

源码：

值对象redisObject：

            typedef struct redisObject {
                unsigned type:4;
                unsigned encoding:4;
                unsigned lru:LRU_BITS;
                int refcount;
                void *ptr;
            } robj;

类型type：

说明：查看当前键的类型：type key

            #define OBJ_STRING 0
            #define OBJ_LIST 1
            #define OBJ_SET 2
            #define OBJ_ZSET 3
            #define OBJ_HASH 4

编码encoding；

说明：查看当前键的编码：object encoding key

            #define OBJ_ENCODING_RAW 0
            #define OBJ_ENCODING_INT 1
            #define OBJ_ENCODING_HT 2
            #define OBJ_ENCODING_ZIPMAP 3
            #define OBJ_ENCODING_LINKEDLIST 4
            #define OBJ_ENCODING_ZIPLIST 5
            #define OBJ_ENCODING_INTSET 6
            #define OBJ_ENCODING_SKIPLIST 7
            #define OBJ_ENCODING_EMBSTR 8
            #define OBJ_ENCODING_QUICKLIST 9

最后被访问的时间lru：

            概念：记录对象最后一次被访问的时间。
            说明：
                1>查看当前键的空闲时间(该命令不会更新lru字段)；object idletime key 。可以通过scan + object idletime key 来收集长时间未被访问的数据，然后手动清理。
                2>当配置了maxmemory和maxmemory-policy=volatile-lru或者allkeys-lru时，若内存超过了上限(maxmemory)后，则优先回收长时间没有被访问的数据，从而回收内存。

引用计数器refcount：

概念：记录当前对象被引用的次数，当refcount=0时，可以安全回收当前对象空间。
说明：获取当前对象引用：object refcount key

类型对应的编码：

        字符串：
            int：存放整形值的字符串。
            embstr：存放字符的短字符串(大小不超过44个字节)。
            raw：存放字符的长字符串(大小不超过44个字节)。

            embstr和raw的比较：
                raw调用2次内存分配函数，释放时当然也需要释放两次。
                embstr调用1次内存分配函数，分配一块连续的内存，释放时只需释放一次。

列表(list)：

            压缩列表(ziplist)：
                结构：所有数据都是采用线性连续的内存结构(大致可类比数组)，目的是为了减少内存的占用，追求空间和时间的平衡。
                    1>以O(1)时间复杂度入队和出队。
                    2>读写操作涉及复杂的指针移动，最坏时间复杂度为O(n2)，故列表的元素不易太多。
                    3>新增删除操作涉及内存重新分配，加大了操作的复杂性。

优点：占用内存较少，且占用的是一块连续的内存，故加载的速度相对更快一些。
缺点：当元素的个数较大时，访问元素的时间较长。

应用：

适合存储小对象和长度有限(即使O(n2)的复杂度也不会太大)的数据。
当元素个数小于list-max-ziplist-entries(默认512) 且所有元素值的大小都小于list-max-ziplist-value(默认64字节)时，使用ziplist作为列表的内部实现。

双端链表(linkedlist)：

                优点：元素的个数较多时，访问元素的时间比压缩列表更快一些。
                缺点：因为是双向链表，故维护了前置指针、后置指针等结构，占用了更多的内存，且内存不是连续的，容易产生内存碎片。
                说明：当无法满足ziplist的条件时，使用linkedlist作为列表的内部实现。
                应用：当列表对象元素较多时，压缩列表就会转化为更适合存储大量元素的双端链表。

            注意：只能小内存编码向大内存编码转换。(若当元素增删频繁时，数据向压缩编码转换是非常消耗CPU的，得不偿失)

快速列表(quicklist)：

结构：一个双向链表，链表的每一个节点都是一个ziplist，故quicklist结合了双向链表和压缩列表的优点。
Redis3.2开始，列表采用quicklist进行编码。

哈希(hash)：

压缩列表(ziplist)：

应用：当元素个数小于hash-max-ziplist-entries(默认512) 且所有元素value的大小都小于hash-max-ziplist-value(默认64字节)时，使用ziplist作为哈希的内部实现。

哈希表(hashtable)：

                优点：读写时间复杂度O(1)
                缺点：占用内存较多。
                应用：当无法满足ziplist的条件时，hashtable作为哈希的内部实现。

hash算法：与传统hash算法类似，根据key计算得到在哈希表中的位置，采用单链表解决冲突，达到加载因子时进行扩展，进而引发重哈希。

rehash：采用增量式重哈希：

                概念：在扩容时不会一次性对所有的key进行rehash，而是将key的rehash操作分散延迟到其它操作(哈希表的查找、更新、删除)中。
                优点：避免由于大量的key在同一时间段进行rehash操作导致服务短暂无响应的问题。
                过程：在增量式的rehash过程中，会使用到两张哈希表：
                    查找：先从老表中查找，再从新表中查找，此外还会对一些key进行rehash操作。
                    新增：新增的键值对添加到新表中。

集合(set)：

            整数集合(intset)：
                结构：有序、不重复的整数集。
                    1>查找时间复杂度为O(logn)
                    2>插入时间复杂度为O(n)
                优点：占用的内存远小于hashtable，
                应用：当元素都是整数且元素个数小于set-max-intset-entries(默认512)时，使用intset作为集合的内部实现。

哈希表(hashtable)：当无法满足intset的条件时，使用hashtable作为集合的内部实现。

有序集合(zset)：

            说明：redis给有序集合中的每个元素设置一个分数(score)作为排序的依据。

            压缩列表(ziplist)：
                应用：当元素个数小于zset-max-ziplist-entries(默认128个) 且每个元素的值都小于zset-max-ziplist-value(默认64字节)时，使用ziplist作为有序集合的内部实现。

            跳跃表(skiplist)：
                结构：跳跃表通过在每个节点中(基于层和跨度等)维持多个指向其它节点的指针来实现快速访问。
                    查找时间复杂度平均O(logn)、最坏O(n)。
                应用：当不满足ziplist条件时，使用skiplist作为内部实现。

内存优化：

        场景：有海量key和value都比较小的数据，在redis中如何存储才更省内存。
        原理：通过大幅减少key的数量来降低内存的消耗。
        实现：在客户端通过分组将海量的key根据一定的策略映射到一组hash对象中，由于value较小，故hash类型的对象会使用占用内存较小的ziplist编码。
            eg：如存在100万个键，可以映射到1000个hash中，每个hash保存1000个元素。

以上就是redis中的数据结构和编码详解的详细内容，更多关于redis中的数据结构和编码的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

--结束END--

本文标题: redis中的数据结构和编码详解

本文链接: https://lsjlt.com/news/51471.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

redis中的数据结构和编码详解

redis中的数据结构和编码详解

详解redis数据结构之sds

Redis底层数据结构详解

Redis数据结构之链表详解

redis数据结构之intset的实例详解

【数据结构】 Map和Set详解

详解redis数据结构之压缩列表

Redis 哈希Hash底层数据结构详解

Python Pandas 中的数据结构详解

详解Pytorch中的tensor数据结构

JavaScript中的Map数据结构详解

详解Redis中的双链表结构

Redis底层数据结构之dict、ziplist、quicklist详解

Zookeeper 数据结构详解

JS数据结构与算法中的队列结构详解

redis中有哪些数据结构

Redis中数据结构是什么

Jedis零基础入门及操作Redis中的数据结构详解

Redis的五种数据结构

Redis的数据结构介绍

关于SQL建表语句使用详解

HBase在大数据审计与合规性追踪中的应用

MySQL与HBase在大数据金融分析中的性能与可扩展性对比

HBase的Region Server之间的网络通信优化

HBase在大数据监控与告警系统中的实时数据处理能力

MySQL与HBase在大数据安全策略中的实现与对比

HBase的分布式事务处理在复杂业务场景中的应用

MySQL与HBase在混合存储架构中的整合策略

HBase如何支持高效的二级索引查询

MySQL与HBase在物联网数据收集与处理中的协作模式