我们讲元数据是企业数据管理的基石,主数据是企业经营运作的主体对象。一般而言,都是从元数据或主数据切入,再逐步展开数据治理的其他领域。企业数据的范围很广而且在不断的增加和演变,哪些数据应该作为主数据加以合理的管理?用什么样的原则和方法去识别主数据?本文主要回答以上这些问题。
01认识主数据
首先,我们要了解什么是主数据,主数据(MD Master Data)指系统间共享数据(例如,客户、供应商、账户和组织部门相关数据)。可以在企业内跨越各个业务部门被重复使用的,通常长期存在且应用于多个系统的数据。
主数据的特征如下:①高价值:主数据是所有业务处理都离不开的实体数据,与大数据相比价值密度非常高。②高共享:主数据是跨部门、跨系统高度共享的数据。
③相对稳定:与交易数据相比主数据是相对稳定的,变化频率较低。
主数据具有性、共享性、稳定性、有效性,那主数据与元数据、业务数据有什么区别呢?
主数据与元数据:元数据是描述数据的数据,元数据描述的是数据的属性。而主数据是从元数据中挑选出来的,表征公司业务运行的关键、通用型数据,是一个相对主观的概念。它不仅仅只是表头信息,而是包括实例数据。
主数据与业务数据:业务数据是由企业业务运转产生的数据;这类数据一般会实时更新变化。主数据相对于业务数据而言,属性相对稳定,准确度要求更高,并且具有识别性。
02识别主数据
我们了解了主数据的定义之后,那么企业运行过程中,哪些数据可以称之为主数据呢?
我们通过举例来进行说明。现有5个业务系统,财务系统、OA协同办公系统、CRM采购系统、资金预算系统、人力资源系统。那么5个业务系统都会有不同的人员使用,每一个人员又都分布在各自的公司和部门中,那么人员、部门、公司是不是就具备系统间高度共享的特征?同时基于这些人员、部门、公司所产生的业务、业绩是公司运营的终目的,那么他们是不是又具备了高价值的实体数据的特点?再看人员正常流动的速度和公司订单产生的速度相比,是不是具备了相对稳定的第三个特征?同时满足了以上3个特征,那么人员、部门、公司不就是主数据嘛!
咱们再举一个采购设备的例子,场景是公司要向一个供应商采购一批计算机硬件,咱们来简单分析一下这个业务流程。首先,咱们在资金预算系统里面输入设备的信息,查看有多少的资金预算可以采用。然后,咱们登录到OA协同办公系统,提交采购这批设备的申请流程,这里涉及了2个主数据,人员和设备。这里缺乏权威主数据就会暴露以下这些问题:
首先办理人在OA系统和资金预算系统的标识符是否一致?如果只是名称一致,而标识符不一致,那么在OA系统和资金预算系统数据关联的时候是否就无法直接关联,需要通过映射关联。同样,如果设备只是名称相似,甚至名称都有区别,那么在提交采购申请的时候,领导看到的设备是不是你想采购的设备呢?你想采购设备A,老板看成了B,M部门有张三,N部门也有张三,你是N部门的张三,如果没有标识符进行确认,领导怎么知道你是M部门的还是N部门的?
假如以上流程都通过人工协调解决了,下一步,需要在采购系统录入采购设备信息和设备供应商进行采购申请。然后登录财务系统,提交设备付款申请。这个流程除了设备主数据以外,供应商主数据是否也会在采购系统和财务系统面临着同样的问题即两边的供应商是否是同一个,名称和社会统一信用代码是否是一致的?
所以人员、部门、公司、设备、工商等主数据的建设在以上种种情景下就显得尤为重要了。
03哪些数据作为主数据进行管理
在决定是否应将特定信息元素视为主数据时,建议综合考虑以下这些标准:
1、数据的行为
通过本数据与其他数据交互的行为,来决定本数据是否是主数据。
在业务运营系统中,主数据几乎总是与运营数据有关。客户购买产品,供应商出售零件,合作伙伴将一箱材料运送到某个地点,员工与其经理有层次关系,经理通过经理(另一名员工)向上报告。
主数据和运营数据之间的关系可以从根本上被视为一种名词/动词关系。运营数据就是动词,例如销售、交付、购买、退货,而主数据就是名词,例如产品、客户、材料等。
2、数据的生命周期
主数据都是可以通过创建、读取、更新、删除的方式来描述,此生命周期称为 CRUD 周期。
但是对于不同公司而言,主数据的CRUD的方式是不同的。
例如:如何创建客户取决于公司的业务规则、行业细分和系统功能。一家公司可能有多个客户创建的渠道,如通过网站、通过客户代表或通过门店。另一家公司可能只允许呼叫中心创建客户。
3、数据的基数
随着基数的减少,一个信息元素被视为主数据的可能性也会降低,即使这是一个普遍被认为应该是主数据的领域,比如客户——
如果一家公司只有3个客户,那么该公司很可能不会考虑这些客户信息视为主数据——至少在使用 MDM 解决方案时不会考虑,这是因为使用主数据基础架构管理这些客户没有任何好处。
基数不会改变信息元素的分类。但是,随着信息元素的基数增加,为之配套管理方案的重要性也随之增加。
4、数据的稳定性
主数据的稳定性往往高于运营类数据。随着它变得更加不稳定,它通常被认为更具运营性。
例如,有些人可能会认为“合同”是主数据元素,也有人可能会认为这是一笔运营数据。
根据合同的有效期,它可以采用任何一种方式。
运动员经纪机构可能会考虑他们的合同是主数据。在这种情况下,每份合同都不同于另一个,并且通常具有超过一年的寿命,运动员往往在任何特定时间都有一份以上的合同:一份与他们的团队签订,另一份与公司签订产品代言合同。随着每份合同的要素重新谈判或运动员被交易,该机构将需要随着时间的推移管理所有这些合同。
其他合同——例如汽车清洗合同或房屋粉刷合同——更像是一笔交易。它们是一次性的、短期的协议,用于提供支付服务,通常会在数小时内完成并失效。
5、数据的复杂度
简单的数据,即使它们是有价值的实体,也很少难以管理,所以也很少被视为主数据元素。通常,这些资产被简单地收集和统计。
例如,银行可能不会跟踪它存储的每根金条的信息,而只会记录它们的数量。每根金条价值可观,基数高,寿命长,但复杂度低。
6、数据的可复用性
主数据管理的主要驱动力之一就是复用。由于多种原因,主数据并不总是可以被访问的,人们将主数据存储在不同的位置,例如电子表格或者各系统的数据库。但是,如果一个主数据实体在多个系统中重复使用,那么肯定需要对其进行管理。
7、数据的价值
数据元素对公司越有价值,它就越有可能被视为主数据元素。
如上方法是识别信息元素是否需要纳入主数据进行管理的常用标准。希望能够对读者有所帮助。