分享好友

×
取消 复制
ETL 几种工具的比较(Kettle,Talend,Informatica )
2019-07-17 17:07:01

转: https://blog.csdn.net/u012637358/article/details/82593092

ETL 几种工具的比较(Kettle,Talend,Informatica )

成本:  

软件成本包括多方面,主要包括软件产品, 售前培训, 售后咨询, 技术支持等。 

开源产品本身是免费的,成本主要是培训和咨询,所以成本会一直维持在一个较低水平。 

商业产品本身价格很高,但是一般会提供几次免费的咨询或支持,所以采用商用软件最初成本很高,但是逐渐下降。 

手工编码最初成本不高,主要是人力成本,但后期维护的工作量会越来越大。

风险:  

项目都是有风险的尤其是大项目。 

项目的风险主要包括:超出预算,项目延期,没有达到用户的满意和期望 

开源产品由于价格上的优势,可以在很大程度上降低项目的风险。

易用性:  

Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供。 

Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。 

Informatica:有非常容易使用的 GUI,但是要专门的训练。 

Inaplex Inaport:没有GUI

技术支持 : 

Talend:主要在美国 

Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲(中国,日本,韩国)都可以找到相关技术支持人员。 

Informatica:遍布全世界 

Inaplex Inaport:主要在英国

部署:  

Talend:创建 java 或perl 文件,并通过操作系统调度工具来运行 

Kettle:可以使用 job 作业方式或操作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署。 

Informatica:需要有 Server 

Inaplex Inaport:需要 .net 2.0

速度:  

Talend:需要手工调整,对特定数据源有优化知识。 

Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计。 

Informatica:是最快的 

Inaplex Inaport:没有使用什么优化技术。

数据质量:  

Talend:在 GUI 里有数据质量特性,可以手工写 SQL 语句。 

Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。 

Informatica:专门有一个产品 Informatica Data Quality 来保证数据质量 

Inaplex Inaport:因为只处理特定数据,所以比较容易进行数据清洗。

监控:  

Talend:有监控和日志工具 

Kettle:有监控和日志工具 

Informatica:有非常详细的监控和日志工具 

Inaplex Inaport:有监控和日志工具

连接性:  

Talend:各种常用数据库,文件,web service。 

Kettle:非常广泛的数据库,文件,另外可以通过插件扩展。 

Informatica:各种数据源 

Inaplex Inaport:ODBC 连接

abc :整理的很好
2019-08-05 08:49:20
0
分享好友

分享这个小栈给你的朋友们,一起进步吧。

数据治理
创建时间:2020-06-15 14:35:35
数据治理(Data Governance)是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

技术专家

查看更多
  • 栈栈
    专家
戳我,来吐槽~