绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
大数据平台概述
2023-04-19 17:56:14

主流大数据平台介绍

  • CDH(Cloudera Distribution Hadoop)

由Cloudera公司开发,有开源版本与商业版本,Cloudera公司2018年和hortonworks公司合并,较为出名的贡献为impala是由Cloudera公司开源贡献给Apache基金会。大数据平台在国内各大企业中应用广泛,甚至开源版本在很多公司中都较为常见,是较为受欢迎的大数据平台之一。

  • CDP

是CDH平台的升级版,较为明显的升级动作将权限管理由sentry更改为ranger,增加flink组件parcel包,不用用户自己集成,可直接安装。

  • TDH(Transwarp Data Hub)

是星环科技推出的一款大数据平台,是国内发行版大数据平台,是国内领先的大数据平台,没有开源版本,突出特点:

  1. 对hive高度封装,推出incepter,在性能上相比hive得到明显提升,但是强制分桶,以及事务表等特性。
  2. 对hbase高度封装,推出hyperbase,支持SQL查询,对二级索引支持较好。
  3. FI HD&FI MRS

由华为公司开发,较早版本为fusioninsight HD,后推出fusioninsight MRS,是当前较为成熟且在mpp数据库与混合计算领域较为领先的大数据平台,突出特点:

  1. HD版本中的随机读写数据库为ELK(这个ELK不是es生态的elk,是一个单纯的数据库)
  2. 将kettle进行封装优化,推出loader数据加载组件
  3. 推出国产mpp架构数据库gaussdb 100、gaussdb 200、gaussdb 300
  4. 独有small file小文件管理组件
  5. hetu engine跨源计算
  6. 飞天大数据平台

阿里大数据平台,突出特点maxcompute离线分析模块,flink实时计算引擎,并且做了大量优化与新功能开发。

分享好友

分享这个小栈给你的朋友们,一起进步吧。

大数据新手初入门
创建时间:2022-03-21 20:33:42
分享初学者学习大数据的过程,接触到的各个知识点和小项目。
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

栈主、嘉宾

查看更多
  • carr_fu
    栈主

小栈成员

查看更多
  • LCR_
  • hfx2
  • cai116096
  • anyun198910
戳我,来吐槽~