DMBOK元数据理解=CDGA多考3分
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
一、 前言
元数据是描述数据的数据,主要作用是让数据相关方了解数据如何生产、如何定义、如何分布,如何演变,数据之间有什么关系,以及相互之间的影响。DMBOK2第12章是元数据管理,看这一章语境图时有两个疑问。
二、 问题思考
第一个疑问是技术元数据中第14点“恢复和备份规则”和操作元数据中第8点“备份、保留、创建日期、灾备恢复预案”中的备份有什么区别?怎么理解?
元数据可以分为三类,业务元数据,技术元数据和操作元数据,从实战角度,我们实现一个产品都需要经过业务需求,技术实现,产品运维和使用这三个步骤,分别对应需求方,实现方和产品运维和使用方,这是最核心的理解思路,用这个思路理解,语境图中两个备份就比较清晰了。
我们用上面三个角度看三类元数据的例子,边界是不是清晰多了?不过下面ETL作业详细信息放在技术元数据中,清洗标准放在操作元数据中有点不太好理解,不知道作者是怎么思考的?欢迎留言探讨。
业务元数据 |
技术元数据 |
操作元数据 |
数据集、表和字段的定义和描述 |
物理数据库表名和字段名 |
批处理程序的作业执行日志 |
业务规则、转换规则、计算公式和推导公式 |
字段属性 |
抽取历史和结果 |
数据模型 |
数据库对象的属性 |
调度异常处理 |
数据质量规则和检核结果。 |
访问权限 |
审计、平衡、控制度量的结果 |
数据溯源和数据血缘 |
数据CRUD(增、删、改、查)规则 |
错误日志 |
数据标准 |
物理数据模型,包括数据表名、键和索引 |
报表和查询的访问模式、频率和执行时间 |
特定的数据元素记录系统。 |
记录数据模型与实物资产之间的关系 |
补丁和版本的维护计划和执行情况,以及当前的补丁级别 |
有效值约束 |
数据血缘文档,包括上游和下游变更影响的信息 |
数据归档、保留规则和相关归档文件 |
利益相关方联系信息 |
文件格式模式定义 |
服务水平协议(SLA)要求和规定 |
数据的安全/隐私级别 |
源到目标的映射文档 |
容量和使用模式 |
已知的数据问题 |
恢复和备份规则 |
备份、保留、创建日期、灾备恢复预案 |
数据使用说明 |
ETL作业详细信息 |
清洗标准 |
第二个问题是语境图中输入为什么有过程元数据而实际详解中却找不到?是多写了,还是有其它的理解? 欢迎大家留言探讨。
三、 结语
上面是我对元数据的一些思考,希望对您有启发,您是从哪个角度理解的?欢迎留言探讨或加我微信,我们一起学习,思考数据治理理论,一起持续完善数据治理体系。
理论研究DMBOK,实战研究华为数据之道,公众号《数据治理体系》后台回复"数据治理",下载DMBOK2和华为数据之道等数据治理相关文档。
更多资料请点击:数据治理体系资料合集
想要了解更多内容?
持续完善数据治理实战体系,数据仓库、标签、指标体系,实现业务数字化,数字资产化,资产业务化,资产资本化;回归业务场景的数字化案例才最具参考价值,最容易理解和借鉴的。关注我,和您一起终身学习。
白皮书上线