如何让redis 迁移大key的restore性能提升6倍-阿里云开发者社区

如何让redis 迁移大key的restore性能提升6倍

2016-11-24 11071

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS PostgreSQL Serverless，0.5-4RCU 50GB 3个月

云原生数据库 PolarDB 分布式版，标准版 2核8GB

云数据库 RDS MySQL，集群系列 2核4GB

简介： redis支持migrate key的命令，支持从源redis节点迁移key到目标节点上，目标节点再执行restore命令，将数据加载进内存中。以200M，数据类型为zset(skiplist) 的 key为例，测试环境为本地开发机上两台redis，忽略网络的影响。原生的redis 在 ...

redis支持migrate key的命令，支持从源redis节点迁移key到目标节点上，目标节点再执行restore命令，将数据加载进内存中。以800MB，数据类型为zset(skiplist) 的 key为例，测试环境为本地开发机上两台redis，忽略网络的影响。原生的redis 在restore时执行需要163s，优化后的redis执行需要27s。

1. 原生redis restore的性能瓶颈

通过扁鹊工具分析，可以看到cpu的运行情况如下：

查看源码可知，migrate 遍历出来的zset 中的hashtable值和score，序列化之后打包给目标节点。
目标节点在反序列后重新构造了zset的结构，包括zslinsert， dictadd 等操作。当数据量越大时，重构的代价也就越大。

2. 优化方法

已知瓶颈在重构数据模型，所以优化的思路就是将源节点的数据模型也一并序列化打包给目标节点。目标节点解析后预构造出内存，再按解析后的member填鸭进去即可。
zset 可以说是redis中最为复杂的数据结构，以zset为例，阐述如何优化。

2.1 zset的数据结构

zset 由两个数据结构组成，一个是hashtable 结构的dict，存储的是每个member的值及对应的score，另一个是skiplist的zsl，按序排列每个member。如图所示：

2.2 序列化zset结构模型

redis中，zset的dict 和 zsl 中member 和score的内存是共享的，两种结构，一份内存。如果在序列化中描述一份数据两种索引成本反而更高。

2.2.1 序列化dict模型

再细看cpu的性能消耗，hashtable部分更多消耗在计算index， rehash（即预分配的hash table的size不满足时，需要使用一个更大size的hashtable，将旧的table挪到新的table中），compare key（在链表中遍历判断key是否已经存在）。
基于此，在序列化时带上最大的hashtable的size，restore时指定生成size大小的dict table，去掉rehash。
restore zsl 结构，反序列化出member，score，重新计算member的index，插入指定index的table中，因为遍历出来的zsl不会有出现key冲突的情况，省去compare key，直接将相同index的member接入到链表中。

2.2.2 序列化zsl模型

zsl 有多层结构

结束语

如此zset的数据模型描述完成。对restore的性能更快，但是同时会消耗更多的带宽，多出来的带宽是描述节点的字段。800MB的数据，优化后比优化前多出20MB数据。

云数据库Redis版（ApsaraDB for Redis）是一种稳定可靠、性能卓越、可弹性伸缩的数据库服务。基于飞天分布式系统和全SSD盘高性能存储，支持主备版和集群版两套高可用架构。提供了全套的容灾切换、故障迁移、在线扩容、性能优化的数据库解决方案。欢迎各位购买使用:云数据库 Redis 版