如何做好企业主数据识别工作
发布时间:2023-09-07 21:19 浏览次数:次 作者:admin
在对数据进行挖掘和深度分析应用时,因采集多个系统中的数据,增大数据集成整合难度,影响数据质量及实际应用效果。因此,主数据建设就尤为重要,而首先要做的工作任务就是对主数据进行识别。
1►
数据识别流程
茫茫数据大海中识别出主数据是一项非常复杂的工程,它不仅要依靠专业经验并结合行业特征,同时也要依靠一定的方法理论支撑。主数据的识别主要采用多因素分析法。使用这种方法能够把一组反映事物性质、状态、特点等的变量简化为少数几个能够反映出事物内在联系的、固有的、决定事物本质特征的因素。
多因素分析法的最大功用在于,运用数学方法,对可观测的事物在发展中所表现出的外部特征和联系进行由表及里、由此及彼、去粗取精、去伪存真的处理,从而得出客观事物普遍本质的概括。
多因素分析法进行主数据识别的具体流程,如图所示:
2►
数据元素收集
企业的数据来源广泛、数据类型多样、数据间关系复杂等因素给数据元素收集工作带来了一定的挑战。为了保证数据元素收集工作的顺利开展,需要基于企业的业务场景及数据应用情况,合理界定数据元素收集范围、规划数据元素收集流程,以实现数据元素收集的全面覆盖、不重不漏、真实可靠。
在数据元素收集过程中,通常采用“业务流程+IT系统”相结合的方式。
业务流程梳理是一种“自顶向下”的方法。该方法的优点在于,企业能够对现有数据资源有个全面、系统的认识。特别是通过对业务域之间交叉信息的梳理,使企业更加清晰地了解到信息的来龙去脉,有效消除“信息孤岛”和数据冗余,控制数据的唯一性和准确性、为确保获取信息的有效奠定基础。缺点则是需要花费较长的时间与较高的人员成本。
IT系统梳理是一种“自底向上”的方法。通常先确定主数据的主题域或数据范围。在既定的数据范围内,摸透企业主数据的管理情况、数据标准情况、数据质量情况、数据共享情况等。
该方法的优点在于针对性强,快速实施、快速见效;缺点则是梳理的数据不够全面和系统。一般是在企业有了明确的项目目标和范围的情况下,且自身的信息化建设较为完善的前提下,采用该方法最佳。
3►
主数据的分类
主数据主要包括核心主数据与配置型主数据。其中,核心主数据是用来描述企业核心业务实体的主数据,是企业核心业务对象、交易业务的执行主体。是企业信息系统的神经中枢,是业务运行和决策分析的基础。其相对“固定”,变化缓慢。
而配置型主数据会在整个组织内共享使用,是描述业务或核心主数据属性分类的参考信息。一般依据国际标准、国家标准、行业标准或企业标准和相关规范等,在系统中一次性配置使用的基础数据。其特点在于相对稳定,不易变化。
4►
主数据的特性
(1)特征一致性
主数据的特征经常被用作业务流程的判断条件和数据分析的具体维度层次,因此保证主数据的关键特征在不同应用、不同系统中的高度一致是将来能否实现企业各层级的应用整合,也是企业数据仓库成功实施的必要条件。
(2)识别唯一性
在一个系统、一个平台甚至一个企业范围内同一主数据要求具有唯一的识别标识(编码、名称、特征描述等),用以明确区分业务对象、业务范围和业务的具体细节。
(3)长期有效性
主数据通常贯穿该业务对象的整个生命周期甚至更长。换而言之,只要该主数据所代表的业务对象仍然继续存在或仍具有比较意义,则该主数据就需要在系统中继续保持其有效性。如果是短期使用,一般不作为主数据。
(4)数据共享性
主要通过分析数据类型被多少业务域、业务部门、信息化系统所使用来判断数据的共享程度。
通过上述中关于主数据的识别方法,可以构建主数据识别的评分体系,对主数据中的每个维度分配权重;根据主数据的评价维度,对划定的范围进行评分,根据数据评分,我们选取其中符合分值标准以上的数据,纳入到现阶段主数据管理的范畴。