傅一平评语:
这篇文章讲了2022年数据管理的五个趋势,可能是翻译的原因,理解起来有点别扭,我就简单解读下,当然自己水平有限,大家可以延伸阅读:
趋势一:多云和跨云管理
企业上云后,很自然的想法就是能够基于一个元数据管理系统管理多云的数据,比如数据工程师可以通过运行在AWS上的数据目录来查找数据,也可以使用运行在Azure上的数据集成服务来访问Snowflake中的数据,并将其移动到谷歌云平台,以便在TensorFlow项目中使用,以上所有操作用一个数据管理引擎就能搞定。
趋势二:AI驱动的数据管理自动化
基于人工智能提升数据管理自动化水平提了很多年了,近企业引入了一个敏感数据自动扫描工具来进行敏感数据的自动识别,挺实用,希望这些案例多一点。
趋势三:数据架构的体系结构
多云环境下使得数据编目、查找、集成和使用变得困难,数据编织是一种解决策略,其能在数据之间建立动态的虚拟链接,能实现智能化且易用的数据目录,能通过自服务的方式实现数据的准备和访问。
趋势四:多域主数据管理(MDM)
要打造多域主数据间的知识图谱,形成业务的全局视图,从而提升端到端的客户体验。
趋势五:数据市场
这点我认同了,企业要把数据开放当成淘宝卖货,多关注点体验,努力促进交易。
正文开始
《IDC全球首席数据官(CDO)大调研》对全球近900名数据进行了调研。根据调研结果,我们发现2022年的数据管理五大趋势:
趋势#1 多云和跨云管理
趋势#2 AI驱动的数据管理自动化
趋势#3 数据架构的体系结构
趋势#4 多域主数据管理
趋势#5 数据市场
调查发现,82%的组织目前正在使用多个云,或者计划在未来12个月内使用多个云。
随着越来越多的应用程序和数据转移到云中,数据面临着越来越复杂的数据管理需求:在同一个云中,跨不同的云中,以及使用本地资源。多云和跨云数据管理对于支持这些不同的拓扑结构至关重要。
图1:多云中的更多数据增加了碎片和复杂性
多云意味着特定的数据管理服务可以在多个云生态系统上运行。例如,能够在亚马逊网络服务(AWS)、微软Azure和谷歌云平台上运行数据集成服务。无论是因为数据主权问题,还是为了避免供应商锁定或并购,多云环境的出现,企业都希望能够灵活地跨云生态系统运行其数据管理服务。
同时,云间数据管理使运行在不同云生态系统上的服务能够无缝地协同工作。例如,数据工程师可以通过运行在AWS上的数据目录和市场服务来查找数据,该服务使用运行在Azure上的数据集成服务来访问Snowflake中的数据,并将其移动到谷歌云平台,以便在TensorFlow项目中使用。
图2:多云和跨云数据管理示例
自动化是解决大规模数据碎片化和复杂性的可行选择。然而,超过三分之二(68%)的受调查组织尚未在整个组织内将人工智能用于数据管理。
图3:用于数据管理的人工智能提高了生产率和灵活性
人工智能可以帮助实现数据管理各个方面的自动化,包括数据发现和编目、数据和应用程序集成、清理和掌握、治理、隐私和数据共享。它还提高了所有数据用户的生产率,包括开发人员、架构师、应用程序管理员、数据管理员、财务分析师和一线员工。
图4:用于数据管理自动化的人工智能示例
使用人工智能实现数据管理自动化增加了人工智能在决策和业务流程中的可操作性。优化的数据管理组织可以:
将人工智能全面用于数据管理的可能性是以往的五倍
为洞察和分析全面操作人工智能的可能性高出三倍
-
将人工智能全面用于过程自动化和优化的可能性提高了六倍
随着组织将更多数据放入更多的云中,他们需要一种方法来连接孤立的数据源,并使整个组织的数据更容易访问。为了解决这些云数据孤岛问题,数据管理正在寻找数据架构的体系结构。
事实上,超过一半(54%)的被调查组织表示,他们正在研究方法和解决方案,或者已经将数据架构的体系结构的某些部分落实到位。
图5:数据架构体系结构有助于优化数据管理
Data Fabric是一个设计概念,它作为一个架构层,用于简化和扩展数据管理任务,并在整个组织中更广泛、更一致地使用数据。
图6:数据架构的关键组件
数据架构的关键组件包括(见图6):
用于发现和管理数据资产的增强元数据目录
用于理解数据资产之间关系的元数据知识图
一个支持人工智能的推荐引擎,用于建议使用数据资产
支持ETL、流媒体和API数据移动的数据准备和数据交付
不同数据管理服务协作的企业数据编排层
嵌入在这五个组件中的是一个AI引擎,它将数据架构执行的数据管理任务进行了自动化。例如,推荐可能感兴趣的数据集,或自动将业务术语和定义与底层技术数据关联,以使业务用户能够自助服务。
随着企业的业务数字化进一步发展,使用云应用程序的数量也在增加。管理端到端的数字体验需要应用程序中提供一致的主数据。
当被问及其数据管理的预算优先事项时,61%的受访者表示,多域主数据管理(MDM)可以360度查看业务,是首要考虑的。
图7:主数据管理是优化数据组织的优先级预算分配
虽然许多公司初专注于管理客户数据,但他们很快意识到,需要管理和连接材料、供应商、产品、位置和主数据的其他领域,以获得360度的业务视图,从而帮助他们提供卓越的数字体验。利用多域MDM改善体验的一些方法包括:
客户体验:使营销部门能够通过客户、产品和渠道数据来了解偏好并提供个性化服务。跨客户接触点提供个性化支持和服务。
产品体验:使商务和商品销售团队能够使用客户、产品和位置数据,在整个客户旅程中提供更加吸引的相关产品体验。
供应商经验:使采购和供应商关系团队能够使用供应商、材料和位置数据简化供应商入职流程,并更好地管理整个组织内供应商的总开支。
财务经验:使财务规划和分析团队能够使用客户、产品、渠道、供应商、成本中心和位置数据来建模场景,制定计划,并提供及时的报告和分析。
图8:将多个主数据域连接到客户的360度视图中
图8显示了Informatica如何将客户、策略和位置主数据与交互、交易和服务请求数据连接起来,以创建一个知识图,提供客户及其与公司交互的全面360度视图。
数据具有变革性。它推动产品和服务的创新,增强协作能力,改变企业和社会。然而,72%的受访者表示,大多数业务线员工无法自行获取他们需要使用的所有数据。
为了满足对更大数据访问和共享的需求,我们相信,2022年,从仅仅编目数据扩展到更全面的数据市场功能的趋势将会加快。
图9:优化的数据组织高度关注数据的访问和使用
虽然数据目录是数据市场的一个组成部分,但该市场还提供订单的管理以及交付和履行功能。它通过类似于零售行业在线购物体验简化了数据消费体验。只需点击几下,员工就可以搜索感兴趣的主题或领域、将数据集添加到购物车、结账并安全地交付数据。
更先进的数据市场还确保以合规和道德的方式使用组织的数据资产。数据治理策略可以映射到数据集,然后使用这些数据集根据所访问的数据类型创建数据使用的条款和条件。这为数据消费者提供了正确使用的指导,消费者在获得访问权限之前必须接受这些条款。市场提供了对谁在使用什么数据、在哪里使用数据以及用于什么的完全可审计性。
图10:使用数据市场简化业务自助服务
图10显示了Informatica如何利用云数据市场简化业务用户的数据查找、理解和消费。
原文链接:https://mp.weixin.qq.com/s/PQ1txAsK9ZlqOveonWR0Hw