1.3 数据治理治什么
在我们的生活和工作当中,数据无处不在。在企业的数据中混杂着很多脏数据,这些脏数据是无关企业任何利益的数据,没有治理的必要。数据治理的对象必须是重要的数据资源,是关乎企业商业利益的数据资源,这样的数据资源方可称为“数据资产”。
北京大学教授王汉生先生说过:“数据治理不是对‘数据’的治理,而是对‘数据资产’的治理,是对数据资产所有利益相关方的协调与规范。”
我们分三部分来理解王教授的这句话:
- 什么是数据资产?
- 数据资产的利益相关方是谁?
- 协调与规范的对象是什么?
1.3.1 什么是数据资产
并非所有数据都是数据资产,那到底什么才是数据资产呢?
目前,关于如何将企业的数据作为一项资产来计量、管理尚未形成一个明确的标准。《企业会计准则——基本准则》第20条规定:“资产是指企业过去的交易或者事项形成的、由企业拥有或者控制的、预期会给企业带来经济利益的资源。”其中,“由企业拥有或者控制”是指企业享有某种资源的拥有权或者控制权,“预期会给企业带来经济利益”是指直接或者间接导致现金和现金等价物流入企业的潜力。
由资产的概念引申到数据资产,可以得到:“数据资产是指企业过去的交易或者事项形成的,由企业拥有或者控制的,预期会给企业带来经济利益的数据资源,并且其价值和成本是可计量的。”
由此可见,数据要成为数据资产,至少要满足4个核心条件。
(1)数据资产是企业的交易或者事项形成的
这一条很好理解,数据资产要是企业日常的生产经营活动中积累的数据,或者由于业务需要而被企业实际控制的数据。例如,互联网公司的各种网站、电商平台、社交平台每天产生的大量数据实际都是被这些互联网公司控制的。另外,企业从第三方交换或者购买来的数据也是符合这个定义的。目前有一些组织专门做数据交易的生意,例如数据堂、贵州数据交易所、华中数据交易所等。
(2)由企业拥有或者控制
这一条涉及数据的确权问题。对于数据的归属权、控制权、使用权的问题,目前我国还没有完善的法律法规。对于传统企业来说,这个问题不是很明显,这里主要谈互联网平台。互联网平台上产生的数据主要来自广大用户的上网行为,例如浏览、购买、支付、评论、发帖、发微博、发微信等。这些数据的产权方是谁?这不是一个容易回答的问题。实际上,互联网平台提供了数据存储和管理服务,拥有了数据的实际控制权。在笔者看来,数据在谁那里能够发挥出最大的价值,能够最好地服务于人类和社会,数据就应该归谁所有。当然,利用收集的数据做一些侵犯个人隐私或其他违法犯罪的事情是绝对不允许的。
(3)预期会给企业带来经济利益
企业运营中可能会产生大量的数据,数据在被有效整合、利用后会产生巨大的价值。数据要成为资产,首先要具备可利用性,这样才能给企业带来可预期的经济收益,否则就不是资产。另外,如果数据的获取、管理和维护成本大于其实际产生的收益,或者企业无法通过自用或外部商业化对数据进行有效的变现,那么这些数据也不能视为资产。
(4)成本或价值可衡量
数据成本一般包括采集、存储和计算的费用(人工费用、IT设备等直接费用和间接费用等)以及运维费用(业务操作费、技术操作费等),这是相对容易计量的。数据价值主要从数据资产的分类、使用频次、使用对象、使用效果和共享流通等维度计量。基于数据价值度量的维度,选择各维度下有效的衡量指标,对数据的活跃性、数据质量、数据稀缺性和时效性、数据应用场景的经济性等多方面进行评估,并优化数据服务应用的方式,最大限度地提高数据的应用价值。所以,数据的价值取决于数据的应用场景,同样的数据在不同的应用场景中产生的价值是不一样的,这也是数据资产价值难以计量的重要原因。
1.3.2 数据资产的利益相关方
根据数据资产的定义,数据资产的利益相关方包括以下几类。
- 数据的生产者,即通过业务交易或事项产生数据的人或组织。
- 数据的拥有者或控制者。生产数据的人不一定拥有数据,例如我们上网产生的各种数据都不归我们自己所有,而是落在了各个互联网公司的数据库中。
- 数据价值和经济利益的受益者。
数据治理就是对数据生产者、拥有者或控制者、数据价值受益者进行规范和协调,让数据能够规范化、高质量输出。
1.3.3 对利益相关方的协调和规范
(1)数据的标准化
定义统一的数据标准,比如“写中国字,说普通话”,让数据资产的利益相关方用同一种“语言”沟通。数据的标准化包含几个层面:数据模型标准化,主数据和参考数据的标准化,指标体系的标准化。对于这些内容,我们将在后续章节中详细展开。
(2)数据的确权
数据一旦成为资产,就一定有拥有方或者实际控制人,可以把他们统称为产权人。实物产品的产权是比较明确的,而数据的产权则比较复杂。对于实物产品,在生产制造过程中,在消费者购买之前,制造商拥有完全产权;在实物产品生产出来后,消费者通过支付一定金额的货币便拥有了其产权。
而数据的生产过程不一样,我们每天的各种上网行为,例如网上购物、浏览网页、使用地图、评论/评价等都会产生大量的数据,这些数据到底归谁所有?控制权该如何治理?互联网数据的确权目前已经是一个世界级难题!近几年一些不良商家滥用用户的上网数据,导致安全隐私泄露事件层出不穷。希望随着技术的进步和法律的完善,人们能够尽快找到解决方案。
(3)流程的优化
数据治理有两个目标:一个是提升质量,另一个是控制安全。做好企业业务流程的优化可能会对隐私保护起到一定的作用。通过业务流程优化,规范数据从产生、处理、使用到销毁的整个生命周期,以使数据在各阶段、各流程环节中安全可控、合规地使用。
另外,通过一定的流程优化,通过对相关流程进行监管,按照数据的质量规则进行数据校验,并采用符合“垃圾进,垃圾出”的数据采集、处理、存储原则,以提升数据质量,赋能业务应用。
让数据成为资产就是要让数据为企业创造价值,而做好数据治理才能更加方便、放心地使用数据,这是一个基本前提。数据治理是一个非常复杂的系统工程:
- 管理上,数据治理是企业战略层面的策略,而不是战术层面的方法;
- 业务上,通过数据治理要让数据能够管得住、看得见、找得到、用得好;
- 技术上,涉及数据建模、数据集成、数据交换、数据清洗、数据处理、数据质量管理的方方面面。
最后再次强调,数据治理不是对“数据”的治理,而是对“数据资产”的治理。数据治理可以有效盘活企业的数据资产。