为健全数据治理奠定基础
随着公司对所有“数据”(分析、报告、仪表盘、大数据、预测分析、决策科学等)的关注,数据治理也越来越重要。一个好的数据治理程序让业务涉众参与决定数据定义,支持或支持整个组织的一致数据使用。
数据治理模型可以是松散的,也可以是高度结构化的。结构化数据治理通常需要形成一个数据治理委员会、一个定义的章程、确定的数据管理员以及规定的策略和过程。数据管理员“拥有”特定的数据集或系统,并负责确定相关的业务定义和标准。数据治理委员会监督更广泛的数据治理过程,以确保其得到持续的管理和关注。对于认真对待数据质量并愿意投入时间和资源来确保数据质量的公司来说,这是一种很好的方法。
我的经验集中在我所说的“基层”数据治理上。数据治理成功的主要要求是拥有广泛的业务涉众表示和参与。参与者需要致力于做出决定,将这些决定适当地传达给他们的组织,并带回他们的团队的反馈。理想情况下,它们驱动数据治理程序。我确实联系了公司的首席运营官,让他们参与进来。
在我第一次使用数据治理的经验中,早在20世纪80年代,我们就把这个组称为Bar,它代表业务领域的代表。我们第一次建立企业数据仓库时就成立了这个小组。它开会审查业务概念模型和逻辑数据模型。大多数小组成员都参与了最初的面谈,这导致了这些模型的发展。我们就业务定义和各种需求咨询了该集团。随着时间的推移,该条帮助识别业务的关键绩效指标(KPI)和数据仓库的关键数据质量指标。12年后,数据仓库从3 TB增长到84 TB,而BAR仍然存在。它继续提供有关未来状态远景、业务定义、数据质量过程和开发优先级的业务决策。在我最近一次开发数据治理程序的尝试中,我召集了来自组织中所有主要部门的代表。我们回顾了业务概念模型和逻辑数据模型。我们提供了关于数据仓库可交付成果的演示,以及我们正在开发的标准报告。集团是我们对业务定义和需求做出决策的主要来源。
最近的一个示例演示了数据治理组的有效性。我们向小组提出了一个关于业务定义的问题,我称之为“付款”。在公司的三个部门中,我们了解到有三种不同的定义被用于付款。结果是在向公司领导汇报时出现了不一致。我知道我们在数据治理方面取得了成功,当时一位财务人员自愿与运营和决策科学部门的代表离线会面,提出建议,并将其带回数据治理小组进行审查和批准。这是进步!
拥有一个成功的数据治理组是实现敏捷开发的基础步骤。团队成为敏捷开发过程的核心部分,每一步都要审查和批准可交付成果。它可以继续监控并确保随着时间的推移正在构建的内容始终反映组织的业务。
构建敏捷数据仓库开发基础方法的其他步骤包括:-开发具有可重复设计模式的高级架构。
-确保可靠的测试和工具。
-实施稳健的数据质量计划。
-赋予开发团队自我管理其敏捷开发方法的能力,包括持续改进。