Hive整合Hbase是现阶段比较成熟的一套基于HBase实现SQL引擎的方案,现在业内的使用也比较多一些,
但是每个都有其优势和劣势,Hive整合HBase方案的缺点和缺点如下:
优点
- 1).配置、使用简单,大大提高使用效率。熟悉SQL或熟悉Hive使用的人,可以轻松掌握,学习成本低
- 2).减少所需编写代码量
- 3).低耦度整合,对Hive和HBase的依赖度低,没有较大耦合度
- 4).由Apache官方提供,从Hive0.6开始支持,更新比较及时,bug较少,可以用于生产环境
缺点
- 1).查询速度慢,大部分操作都需要启动MapReduce,查询过程比较耗时
- 2).对HBase集群的访问压力较大,每个MapReduce任务都需要启动N个Handler连接HBase集群,这样会大量占用HBase连接,造成资源使用紧张
- 3).列映射有诸多限制。现有版本的列映射以及Rowkey的限制很多,例如无法使用组合主键,无法使用timestamp属性(版本)
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/15498/viewspace-2108497/,如需转载,请注明出处,否则将追究法律责任。