当前位置:主页 > 行业资讯 > 数据治理 >

数据治理的新实践和思路

发布时间:2023-10-19 21:35   浏览次数:次   作者:admin

识别关键数据元素,并将其视为战略资源进行定量管理

首先,我们需要对数据资产进行分级划分,确定哪些数据资源应该首先被视为资产,以及哪些数据资产的质量处理级别应该是高优先级的。

当企业从零开始建立数据治理体系时,阶段性的数据治理需要评估,确定哪些数据资产应该首先进行资产化。这个决策应该基于已建立的数据资产分级划分。

当前的分级管理需要考虑一些关键因素,包括业务重要性评估、数据访问热度、使用频率、下游数据类型等等,以及数据链路的深度和数据的层级。

在不同的项目中,我们需要对新增的元数据进行注册时进行价值模型评估,并对存量数据进行圈定。这样,我们可以划分优先级,估算数据治理的成本,并根据不同的分类阶段性地推进数据治理工作,以实现长期投入和回报的平衡。

"以用促治",贯穿整个数据生命周期的策略和流程,实现端到端管理,跨管理领域的纵向实践

(1) "以用"的定义
"以用"的定义是在实际项目开展中进行数据治理,重点关注核心系统以及与经营和管理直接相关的系统,以实现数据资产化。

(2) 全生命周期
全生命周期的核心思想是在整个项目流程中,无论是数据标准、元数据注册、数据质量还是数据安全,都要将流程扎实贯彻。在项目从开始到结束的整个过程中,应该坚持管理理念,并将流程本地化,然后提炼和总结,形成通用化的流程,作为企业级标准流程。

这样一来,不仅有了数据质量和数据治理全过程的实践经验,还形成了通用的成果,更容易获得高层支持。

(3) 纵向事件
对于资源有限的企业,不宜一开始就全面展开数据治理。应该选择某一个纵向领域,例如某一业务领域,对该领域的各个管理领域的模块进行深入了解和实践,而不是全面铺开。一旦在一个纵向领域取得成功,将这种信心转移到其他业务领域,以获得更好的支持。

让业务用户深度参与治理过程,提高治理效率,利用AI提升参与过程的智能化体验
要让业务用户深度参与数据治理过程,以提高效率,需要利用AI来提升整个过程的智能化体验。整个数据治理过程需要根据定制需求来进行,因为这不是一个通用模块,而是需要定制化的。平台需要随着管理思路的变化而不断更新。对于一些重复性的工作,如元数据处理,在元数据注册过程中,智能填充翻译和业务含义,以及元数据与数据标准的对齐,都需要考虑智能化。

除了定制化整个平台,还需要将数据和AI能力相结合,将重复性工作剥离出来,并将一些明确的规则作为训练集用于训练其他任务,使其能够自动化、智能化地完成所需的工作。

分类分级权限矩阵,强化数据安全的智能化管控
分类分级权限矩阵需要强化数据安全的智能化管控。这需要平台与AI的结合。

(1)根据行业分类分级指南,将已知的元数据根据标准进行分类和分级,作为基础的训练集。然后将算法应用于其他元数据,实现元数据的自动分类和目录挂载。最后,通过人工核验来不断校正和优化算法。

首先,在证券行业有一个分类分级的指南,提供了一个参考清单。有了这个清单,我们可以将现有的技术数据标准进行分类和分级。然后,将这些作为训练集进行训练,将算法应用于其他元数据,实现自动分类和目录挂载;之后,通过人工核验来不断校正和优化算法,以实现自动化分类和分级。

(2) 敏感数据的自动识别和定级
接下来,需要自动识别和定级敏感数据,包括静态和动态脱敏策略的执行。

有些平台已经具备这一功能。例如,网易数帆平台提供了自动识别敏感数据的功能。

(3) 数据服务和审批流程
最后,需要在安全性方面应用分类分级权限矩阵。

核心是数据服务的审批流程。不同的数据分类、不同的数据等级以及是否属于敏感数据,将决定数据服务的审批流程。例如,数据访问、离线数据导出以及跨系统数据请求都将根据这些核心审批点进行判断,走不同的审批流程。

(4) AI:数据异常访问监控与预警
最后,还需要建立AI模型来监控和预警数据异常访问,例如高频下载等。

以上是数据治理过程中的一些实践和思考,总结为四点。
(部分内容来源网络,如有侵权请联系删除)