绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
关键特性-全并行的数据查询处理
2020-01-06 17:24:41

全并行的分布式查询处理是GaussDB 100中最核心的技术,它可以最大限度的降低查询时节点之间的数据流动,以提升查询效率。

GaussDB 100为达成高性能数据分析目标,实现了一套高性能的分布式执行引擎,执行引擎以SQL引擎生成的执行计划为输入,将元组按执行计划的要求进行加工并将结果返回给客户端。

图1 分布式查询示意图
GaussDB 分布式查询示意图

一个涉及多个执行算子的复杂查询的大概执行过程如下:

  1. CN接收到查询任务(通常是SQL语句描述)后,对SQL语句进行语法解析并分解出基础的查询和数据处理执行算子,比如DataScan、Sort、Aggregation以及Join。
  2. 随后CN会生成最优的基础任务执行序列,并将这些基础任务部署到各个节点上去执行。
  3. 各个DN完成数据处理后,会将结果汇总到CN上并输出到客户端。
分享好友

分享这个小栈给你的朋友们,一起进步吧。

GaussDB_数据库
创建时间:2020-01-06 16:21:44
华为GaussDB数据库小栈
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

技术专家

查看更多
  • GaussDB_数据库
    专家
戳我,来吐槽~