您当前的位置:首页 > 电脑百科 > 程序开发 > 算法

分布式寻址算法

时间:2019-12-24 11:00:16  来源:  作者:

一、分布式寻址算法简介

分布式寻址算法是很重要的内容,不了解这些算法,也就不能透彻的了解各种分布式中间件的原理。简单说一下这些高大上的寻址到底是个啥意思,比如在elasticsearch中,采用的是多分片,每个分片上存储的是不一样的数据,是一种并集关系。比如我们通过_id去搜索一条数据,elasticsearch怎么知道这个_id的数据是存在哪个分片上?再比如redis cluster中通过key去查询一条数据,redis集群中怎么知道这个key在哪个节点上?所以这就是寻址算法要解决的问题。

简单介绍三种分布式寻址算法

1 hash算法2 一致性hash算法3 hash slot

hash算法比较适合固定分区或者分布式节点的集群架构,比如elasticsearch中primary shard是固定并且不能改变的。所以采用hash算法是一种不错的选择,当然ES确实也是这么做的。感兴趣的可以看我的另一篇关于ES的博客。https://www.cnblogs.com/hello-shf/p/11543480.html

shard = hash(routing) % number_of_primary_shards (routing默认_id)

分布式寻址算法

 

一致性hash算法比较适合需要动态扩容的分布式架构以及一些动态负载均衡的分布式中间件和RPC中间件。

redis cluster应用的是hash slot实现的一致性hash寻址。

二、hash算法

比如在elasticsearch中,假如有3个primary shard。

shard = hash(_id) % 3;

插入一条数据,通过以上公式我们很容易能确认该数据存在了哪个分片上。按照_id查询的是有同样通过以上公式很容易找到该数据位于哪个分片上。

以上算法看上去一切都是那么美好,然鹅。。。

假如primary shard需要扩容意思也就是需要增加一个primary shard怎么办?(仅仅是假如,elasticsearch primary shard是不可变的)hash公式变成下面这样

shard = hash(_id) % 4;

是不是就会发生寻址错误?

这就意味着当增加分区需要将原来各个分区上的数据按照shard = hash(_id) % 4的hash取模结果将数据搬运到对应分区上去。假如当有海量数据怎么办?说实话很难办。当发现一个shard宕机,需要快速容灾处理时候,也是一样的问题。

三、一致性hash

可以说一致性hash就是解决以上动态扩容和缩容问题而诞生的。在分布式架构中如果不支持动态扩容和容灾,分布式=鸡肋,没毛病吧。

其实一致性hash听起来那么牛X,其实也没啥高级的,只不过是一种更加高级的hash取模运算而已。

分布式寻址算法

 

如上所示,一般的hash环是hash取模运算的node = hash(key) % n;n取2^32,即形成了一个从0~32的hash环。寻址按照顺时针进行查找最近的一个节点。

node = hash(key) % n
分布式寻址算法

 

有4个节点按照IP取模即node = hash(IP) % n落在了如上图所示的位置,这时一个请求,根据node = hash(key) % n求出该请求落在了如下图所示位置,按照顺时针查找,找到该请求命中节点2。这就是这么一个简单的寻址过程。

扩容:

在原来4个节点的基础上,增加一个节点5,依然根据根据IP取模即node = hash(IP) % n确定节点在hash环上的位置。如下图所示。

分布式寻址算法

 

可见原来的请求就命中了节点5,所以我们依然需要进行数据的迁移,但是只是部分的,只需要迁移1-2节点之间的数据即可。相对hash取模,一致性hash算法减少了扩容带来的数据迁移量太大的问题。容灾同理。

但是一致性hash算法存在的问题也是很明显的,因为节点很难均匀的落在hash环上。但是有效的减少了动态增删节点带来的数据迁移问题。

四、hash slot

hash slot即hash槽。redis cluster采用的正式这种hash槽算法实现的寻址。以redis cluster为例。

在redis cluster中固定的存在 16384 个hash slot。

hash slot = CRC16(key)%16384;

#CRC16算法可以简单的理解为一种hash算法。详见度娘。

这样我们就能找到key对应的hash slot。其实按照我的理解,hash slot就是在寻址和节点间加了一层映射关系。当节点动态变化,只需要改变hash slot ==> 节点的映射,然后只需要迁移指定slot到新添加的节点即可。既减少了hash寻址带来的数据全量迁移问题,相对一致性hash也使得负载均衡效果更加明显。

分布式寻址算法

 

如上图,如果我们有三个节点。redis cluster初始化时会自动均分给每个节点16384个slot。

当增加一个节点4,只需要将原来node1~node3节点部分slot上的数据迁移到节点4即可。在redis cluster中数据迁移并不会阻塞主进程。对性能影响是十分有限的。

如有错误的地方还请留言指正。



Tags:分布式寻址   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
一、分布式寻址算法简介分布式寻址算法是很重要的内容,不了解这些算法,也就不能透彻的了解各种分布式中间件的原理。简单说一下这些高大上的寻址到底是个啥意思,比如在elastics...【详细内容】
2019-12-24  Tags: 分布式寻址  点击:(58)  评论:(0)  加入收藏
▌简易百科推荐
前言Kafka 中有很多延时操作,比如对于耗时的网络请求(比如 Produce 是等待 ISR 副本复制成功)会被封装成 DelayOperation 进行延迟处理操作,防止阻塞 Kafka请求处理线程。Kafka...【详细内容】
2021-12-27  Java技术那些事    Tags:时间轮   点击:(1)  评论:(0)  加入收藏
博雯 发自 凹非寺量子位 报道 | 公众号 QbitAI在炼丹过程中,为了减少训练所需资源,MLer有时会将大型复杂的大模型“蒸馏”为较小的模型,同时还要保证与压缩前相当的结果。这就...【详细内容】
2021-12-24  量子位    Tags:蒸馏法   点击:(11)  评论:(0)  加入收藏
分稀疏重建和稠密重建两类:稀疏重建:使用RGB相机SLAMOrb-slam,Orb-slam2,orb-slam3:工程地址在: http://webdiis.unizar.es/~raulmur/orbslam/ DSO(Direct Sparse Odometry)因为...【详细内容】
2021-12-23  老师明明可以靠颜值    Tags:算法   点击:(7)  评论:(0)  加入收藏
1. 基本概念希尔排序又叫递减增量排序算法,它是在直接插入排序算法的基础上进行改进而来的,综合来说它的效率肯定是要高于直接插入排序算法的;希尔排序是一种不稳定的排序算法...【详细内容】
2021-12-22  青石野草    Tags:希尔排序   点击:(6)  评论:(0)  加入收藏
ROP是一种技巧,我们对execve函数进行拼凑来进行system /bin/sh。栈迁移的特征是溢出0x10个字符,在本次getshell中,还碰到了如何利用printf函数来进行canary的泄露。ROP+栈迁移...【详细内容】
2021-12-15  星云博创    Tags:栈迁移   点击:(22)  评论:(0)  加入收藏
一、什么是冒泡排序1.1、文字描述冒泡排序是一种简单的排序算法。它重复地走访要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地...【详细内容】
2021-12-15    晓掌柜丶韶华  Tags:排序算法   点击:(16)  评论:(0)  加入收藏
在了解golang的map之前,我们需要了解哈希这个概念。哈希表,又称散列表(Hash table),是根据键(key)而直接访问在内存储存位置的数据结构。也就是说,它通过计算出一个键值的函数,将...【详细内容】
2021-12-07  一棵梧桐木    Tags:哈希表   点击:(14)  评论:(0)  加入收藏
前面文章在谈论分布式唯一ID生成的时候,有提到雪花算法,这一次,我们详细点讲解,只讲它。SnowFlake算法据国家大气研究中心的查尔斯·奈特称,一般的雪花大约由10^19个水分子...【详细内容】
2021-11-17  小心程序猿QAQ    Tags:雪花算法   点击:(24)  评论:(0)  加入收藏
导读:在大数据时代,对复杂数据结构中的各数据项进行有效的排序和查找的能力非常重要,因为很多现代算法都需要用到它。在为数据恰当选择排序和查找策略时,需要根据数据的规模和类型进行判断。尽管不同策略最终得到的结果完...【详细内容】
2021-11-04  华章科技    Tags:排序算法   点击:(40)  评论:(0)  加入收藏
这是我在网上找的资源的一个总结,会先给出一个我看了觉得还行的关于算法的讲解,再配上实现的代码: Original author: Bill_Hoo Original Address: http://blog.sina.com.cn/s/bl...【详细内容】
2021-11-04  有AI野心的电工和码农    Tags: KMP算法   点击:(36)  评论:(0)  加入收藏
相关文章
    无相关信息
最新更新
栏目热门
栏目头条