7.2 现状评估
根据需求和现状调研情况,对企业的数据治理现状进行分析和评估,找出企业数据管理工作中存在的不足,明确数据治理实施的目标和范围。企业数据治理现状评估包括数据思维和认知现状、IT系统现状、数据分布现状、数据管理现状、数据质量现状等多个方面。
7.2.1 数据思维和认知现状
了解企业,尤其是关键干系人对数据治理的基本认知情况对于项目来说至关重要,因为这一认知在一定程度上决定了数据治理项目的实施策略。目前国内不同行业、不同企业对于数据治理的认知水平参差不齐,普遍存在以下两种情况。
(1)缺乏数据思维
数据思维与信息化意识略有不同,具备信息化意识的管理者未必具备数据思维,数据思维是“抓重点,善于简化;求精确,注重量化;知不知,追求真理”的思维模式,是运用数据理性地分析和处理事物。很多管理者惯于依靠自身经验或根据某件事情的规律来判断和解读事物,而不是用数据说话,用数据管理,用数据决策。原因有二:一是没有意识到数据思维的重要性;二是有意忽略数据思维,即便个人判断可能出错,也要维护自己的权威性。这些都会造成数据的重要性被弱化,数据架构出现断层。
(2)盲目跟风
数据领域的新概念层出不穷,如数据仓库、大数据、数据可视化、数据挖掘、领导驾驶舱、人工智能、数据湖、数据中台等,这些新概念为行业带来了活力,加速了人们对数据重要性的认知,但也给企业带来了困惑。新概念还没来得及消化,更新的概念就又出来了。再加上一些商家的不断炒作和过度宣传,给整个行业带来了一定的误导,甚至有的企业还没搞清楚概念就盲目跟风了。于是,就出现了争先恐后上“数据中台”,稀里糊涂搞“数据治理”的现象。
7.2.2 IT系统现状
根据现状调研情况对企业的IT系统现状进行评估,明确企业相关信息系统的数据管理现状、存在的问题等。
IT系统现状评估包含但不限于以下4个方面(见图7-2)。
图7-2 IT系统现状评估的4个方面
- 系统架构。列出每个IT系统的技术架构,如开发语言、数据库、C/S或B/S,单体架构、SOA架构或微服务架构,依赖的中间件等。
- 系统集成。列出每个系统的接口现状,包括是否存在外部接口、有哪些接口、有哪些接口方式等,并说明系统集成的问题,如数据库点对点集成、接口数据丢失等。
- 系统使用。列出每个系统的使用单位、部门、主要用户,并说明系统使用过程中经常存在的问题。
- 系统数据。列出每个系统包含的关键数据,并说明这些关键数据在使用和管理过程中存在的核心问题,例如数据孤岛问题、数据质量问题、数据安全问题等。
7.2.3 数据分布现状
通过数据资源分布图可以清晰地看到企业数据资源的全景视图,根据调研结果绘制数据资源分布图,只需简单两步。
1)数据域划分。数据是从业务中产生的,可以根据企业的业务域划分数据域。这里根据业务域所处企业管理的层级,将企业的数据域分为战略层、经营层、支撑层三个层次。
2)数据资源归类。根据信息化及业务部门调研结果,将梳理出的数据资源归类到对应的数据域中,形成数据资源分布图,如图7-3所示。
图7-3 数据资源分布图示例
小贴士
按照数据域归类是梳理数据资源的方式之一,也可以基于数据来源进行数据资源梳理并形成数据资源目录或地图。
7.2.4 数据管理现状
依据企业信息化及业务现状调研情况,按数据域逐一对企业的主数据、业务数据、指标数据的管理情况进行评估,并给出初步评估说明。
1. 数据管理评估的维度
数据管理现状一般从以下10个维度进行评估(见图7-4):
图7-4 人力资源业务域数据管理现状示例
- 数据定义是否清晰
- 数据模型是否完整
- 数据是否在多个系统共享
- 确权认责是否明确
- 数据标准是否健全
- 数据管理的流程是否已建立
- 数据管理的制度是否已建立
- 数据质量是否满足
- 数据是否实现了集成或共享
- 数据安全是否受控
2. 数据管理现状分析
对企业数据管理现状进行分析,发掘数据管理的关键问题,明确改进方向,一般可以从如下几个方面入手。
- 组织方面:企业是否拥有专业的数据治理组织,是否明确了岗位职责和分工,是否明确指定了数据管理的角色和权责。
- 人员方面:厘清企业数据人才的配置情况,包括数据标准化人员、数据建模人员、数据分析人员、数据开发人员等,以及这些数据人才的占比。另外,除了专业的数据人员,是否明确了业务人员在数据治理中应发挥的作用,以确保业务人员和数据人员在项目实施过程中紧密协作。
- 制度和流程方面:企业数据治理是否有明确的主责部门,在数据的新增、变更、流转、处理、使用、销毁的全生命周期中是否有相应的管理流程和管理制度保障。
- 技术平台和工具方面:在管理数据标准、数据质量、元数据方面,是否有专业的技术平台和工具,以及这些技术平台和工具在企业数据管理中起到的作用、存在的问题和改进的方向。
- 应用方面:在数据分析、数据挖掘、数据报表等方面的应用情况和存在的问题。例如:数据的准确性无法识别,数据分析展示的信息不准,分析结果与实际偏差较大。
- 资金方面:企业的数据治理投入情况。要说明的是,数据治理是一项周期长、投入大的工程,需要长时间投入资金来运维。在实施过程中,经常会出现企业对项目的建设不够重视,不肯投入足够多的资金,或者选择较为便宜的工具进行构建,最终导致项目烂尾。
7.2.5 数据质量现状
“无治理,不分析”,没有好的数据质量,就无法得出有价值的分析结果,分析界面再炫酷、数据算法再优秀也没有用。可见,企业数据质量对数据分析和数据应用有着深刻的影响。
企业数据质量不高表现为多种形式,比如以下几种。
- 缺乏统一的数据标准,同一数据在各系统中有着不同的定义,容易给业务分析带来歧义。
- 缺乏规范的数据标准定义流程,单个业务部门也无力推动系统间数据不一致问题的解决。
- 企业对数据质量不够重视,业务操作没有标准和约束,录入随意,导致基础数据质量差。
- 缺乏有效的管理工具,杂乱无序的数据存储于企业内外部的各个业务应用系统中,系统之间的数据无法互联互通,形成大量信息孤岛。
- 业务系统数据普遍存在数据不完整、不准确、不真实、不及时,以及数据关系混乱等问题。
数据质量问题会对企业的业务和管理产生较大影响,例如:
- 没有统一的数据标准,大量同名不同义、同义不同名的数据对业务部门之间的沟通造成了很大困扰,增加了业务人员的沟通成本。
- 业务系统中的主数据不一致,导致系统之间的数据无法打通,应用集成无法开展,数据分析缺乏统一的口径和维度。
- 业务数据不准确,影响数据分析,分析结果不仅无法支持决策,还可能带来误导。