绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
Elasticsearch 5.x 源码分析(10)从ClusterService 看cluster
2022-01-30 16:12:24

应网友要求,周末看了一下ClusterService这个类,梳理了一下;看看ES是如何响应和处理一个clusterStateChange的。

什么是ClusterState

在我看来,ClusterState就是整个ES进程的所有状态的逻辑封装,里面包含了各式各样的功能的Settings和Configs,每个nodes终都需要维护一个一致的ClusterState属性。在5.0 以后,为了节省网络带宽,ES允许相邻的两个版本可以只发送 diff 数据,而不需要每次都发送整个全量的clusterState。


ClusterService的成员变量不多,重点关注几个它和外部沟通的变量:

这里有三类比较重要的变量

  • clusterStatePublisher 是用来把本机产生的clusterStateChange事件发布到所有nodes 用
  • stateAppliers 当产生一个新event时,这些消费者会消费这些changeEvent
  • clusterStateListener 当完成一个state 的更新后,触发listener通知其改变了

另外还有三个同名的方法,如下图,用于给外部调用提交一个更新事件。


ClusterService::SubmitStateUpdateTask()

调用链从这里开始,如果ES希望去发布一个changeEvent 那么就需要调用这三个同名方法之一;那么谁会去触发一个changeEvent呢?那就多着了,比如Mapping 改变了,shard挂了,有新节点加进来,and so on; 有兴趣的点击调用链自己去看一下,这里不再赘述。

在submitStateUpdateTask() 方法里,会根据入参的config、executor、task 等,根据优先级等因素后用一个UpdateTask类来封装并存入队列。UpdateTask 主要起的就是一个调度作用。后还是回调了ClusterService的runTasks() 方法。


ClusterService::runTasks()

runTasks 做了一些基本校验之后,就进入方法publishAndAppliyChanges()方法,这是一个非常核心的方法,不过做的事情是比较简单的:

  1. 根据新状态重新确定和节点的连接
  1. 如果其本身就是一个Master节点,那么就需要把这个 changeState推送到所有节点去,其中的ClusterStatePublisher下面会介绍
  2. 更新集群配置

  3. 通知所有的appliers 去应用这个变更,ClusterStateAppliers也会稍后介绍
  4. 应用变更

  5. 通知listeners 变更


ClusterService ::clusterStatePublisher

ClusterService 本身是没有集群其他节点信息的,因此如果它是一个Master,并且它要把一个stateEvent发布出去,唯有通过ZenDiscovery,那么很简单,它只需要把ZenDiscovery:publish()挂进来就可以了,初始化代码在Node.java的初始化部分

Publish()的一句核心语句就是


PublishClusterStateAction

publishClusterState 是一个PublishClusterStateAction ,顾名思义它主要负责和各个节点间的clusterChangeEvent的发送和接受任务;

首先留意一下在什么情况下发送的是diffState,什么情况下发送fullState到其他节点(和ES版本有关),相对应的两个方法是sendClusterStateDiff()和sendClusterStateFull()

在PublishClusterStateAction里总要的两对方法就是

  • sendClusterStateToNode() 和handleIncomingClusterStateRequest()
  • sendCommitToNode()和 handleIncomingClusterStateRequest()

那这个是什么意思呢?还记得吗,ES的Master要向所有node发送一个状态变更的时候,需要有两个过程

  1. 调用sendClusterStateToNode()向所有nodes发送这个状态变更的通知,其他节点接收到的话调用handleIncomingClusterStateRequest()来处理这个事件,这时它仅仅把这个事件存放在queue里而不是立刻应用这个状态变更,因为它需要等待Master的命令,况且,这个事件的前面说不准还有一堆的状态变更还没有响应的,所以其实它什么也没做,回复一个确认
  2. Master会调用sendCommitToNode()到所有的nodes ,当然,之前它必须得到过半数的确认说收到这个变更才行,那么所有收到这个请求的nodes就会调用handleIncomingClusterStateRequest()去消费这个变更,注意在此之前这些nodes需要消费完queue之前的所有变更才行。而Master会启动一个timer来等待Response。

仔细阅读上面4个方法的代码,就是做上面两件事情的,注意代码里仍然有对diff 和full State的判断。


ClusterService::clusterStateAppliers 和ClusterService::clusterStateListeners

其实这两个都是一种listener,需要感知各种状态变更的modules都需要往这里来注册自己的appliers或者listeners 来消费这些状态变更,至于他们之间的差别,主要就是前者是在应用之前需要做些什么,后者是应用了变更之后需要做些什么,有兴趣的可以点进去这些调用栈去看什么modules 注册了这些事件。


至此整个ClusterService 处理ClusterState 的调用链就基本走了一遍了,回顾一下我画了一张图来帮助记忆

作者:华安火车迷链接:https://www.jianshu.com/p/3c9cac4a33ea来源:简书著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
分享好友

分享这个小栈给你的朋友们,一起进步吧。

Elasticsearch
创建时间:2020-05-22 14:49:51
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。我们建立一个网站或应用程序,并要添加搜索功能,但是想要完成搜索工作的创建是非常困难的。我们希望搜索解决方案要运行速度快,我们希望能有一个零配置和一个完全免费的搜索模式,我们希望能够简单地使用JSON通过HTTP来索引数据,我们希望我们的搜索服务器始终可用,我们希望能够从一台开始并扩展到数百台,我们要实时搜索,我们要简单的多租户,我们希望建立一个云的解决方案。因此我们利用Elasticsearch来解决所有这些问题及可能出现的更多其它问题。
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

技术专家

查看更多
  • 栈栈
    专家
戳我,来吐槽~