数据资产治理
数据资产治理(原数据治理中心)可根据预先配置的治理计划,自动发现平台使用过程中数据存储、任务计算、代码开发、数据质量及安全等维度存在的问题,并通过健康分量化评估,从全局、工作空间、个人等多个视角,以治理报告及排行榜呈现治理成果,帮助您高效达成治理目标。同时,还提供业务资产管理、资产分析、任务资源消耗明细、费用预估等功能,帮助您有效掌握各类资源的使用详情。
使用限制
版本限制
目前仅支持DataWorks企业版及以上版本使用数据资产治理。DataWorks各版本介绍,详情请参见DataWorks各版本详解;购买DataWorks,详情请参见购买指引。
地域限制
目前仅支持华东1(杭州)、华东2(上海)、华北2(北京)、华北3(张家口)、华南1(深圳)、西南1(成都)、中国香港、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、德国(法兰克福)、美国(硅谷)、美国(弗吉尼亚)地域使用数据资产治理。
权限限制
使用数据资产治理的用户角色主要如下,其权限限制如下。
角色
权限说明
相关参考
租户级数据治理管理员
租户级数据治理管理员可使用全局视角查看治理评估报告、治理项问题、检查项事件等,执行相应的整改操作。
授权操作,详情请参见管理租户成员角色权限。
数据治理管理员的详细权限,请参见数据治理。
空间管理员
可使用工作空间视角查看治理评估报告。如您需使用该视角查看某工作空间的治理评估报告,需被授权为该空间的空间管理员。
授权操作,详情请参见添加空间成员并管理成员角色权限。
查看治理评估报告,详情请参见查看治理评估报告。
空间级数据治理管理员
该角色可以查看并管理该角色所属空间的数据治理相关内容。
说明该角色不能通过全局视角查看当前地域所有空间下的治理情况,且无法针对全局的治理操作(例如全局允许启用检查项)进行管控。若要允许RAM用户通过全局视角执行上述操作,请授予其租户级数据治理管理员角色。
授权操作,详情请参见添加空间成员并管理成员角色权限。
空间级数据治理管理员角色具体支持的功能详情,请参见数据治理。
普通用户
数据治理工作中实际处理待治理问题的整改人员,可使用个人视角查看检查项事件及治理项问题,并执行整改操作。如您需整改租户下存在的问题,则需被授权为该空间的成员。
说明通常,除阿里云主账号和具有AliyunDataWorksFullAccess权限的RAM用户外,其他租户内成员默认均为普通用户。
授权操作,详情请参见添加空间成员并管理成员角色权限。
目前仅支持阿里云主账号或具有AliyunDataWorksFullAccess权限的RAM用户(即子账号)使用数据资产治理的全部功能。如您需使用数据资产治理的全部功能,则可授予RAM用户该权限,授权详情,请参见为RAM用户授权DataWorks相关管理权限。
数据源限制
目前仅支持MaxCompute、E-MapReduce和Hologres数据源。
说明如需在数据资产治理中使用Hologres数据源,请先在数据地图中采集Hologres元数据。具体操作,请参见元数据采集。
当前仅华北2(北京)、华东2(上海)、华东1(杭州)和华南1(深圳)地域的数据资产治理支持Hologres数据源。
数据治理逻辑
数据治理问题检测包括数据开发任务提交发布前的检查项检测,及提交发布后的治理项检测,帮助您全方位管控当前数据存在的待治理问题。当触发检测项后,若校验不通过,则会生成相应事件(严重问题将阻塞开发流程),您需通过数据资产治理查看并处理该事件问题,直至校验通过后,该任务才可执行后续步骤。数据治理逻辑如下图所示。
DataWorks的工作空间分为标准模式和简单模式,不同模式下工作空间的任务开发流程存在一定差异。本文以标准模式工作空间的开发流程示例。实际流程请根据您使用的工作空间模式为准。不同模式工作空间的通用开发流程,详情请参见数据开发概述。
检查项检测。
用于发布前的管控治理,主要校验规范性问题。在进行数据开发前,可通过检查项对数据开发功能相关的约束进行检查,当检查出存在不符合约束规范的内容时,系统会生成影响开发流程正常执行的问题事件。您可基于该事件处理暴露的问题,以便数据开发流程可以正常执行。
治理项检测。
用于发布后的管控治理。可使用数据资产治理的治理功能,通过全局视角、个人视角或工作空间视角,查看对应的待治理项。数据治理人员可以基于暴露的待治理项,快速发现并解决存在的问题,推进团队内的数据治理目标。
数据治理流程
配置治理工具。
启用治理方案模板并自定义检测项。
细分操作
操作目的
操作指导链接
自定义检查项
若模板中提供的检查项不符合您的需要,则可根据实际情况自定义检查项。
注册检查项。
如果您希望对扩展程序进行检测,则可以注册检测扩展程序的检查项,注册后,数据资产治理后续会检测扩展程序触发的检查项事件。
关闭检查项。
如果模板中包含您无需使用的检查项,则您可以配置指定工作空间停止使用目标检查项,停止使用后,该检查项对目标工作空间不生效,数据资产治理后续将不会检测目标工作空间中该检查项触发的检查项事件。
自定义治理项
如果模板中包含您无需使用的治理项,则可设置排除规则,定义指定治理项在目标工作空间中不启用。排除治理项后,数据资产治理将不会检测该工作空间下对应的治理项问题。同时,在待治理列表中也不会展示该治理项问题。
说明数据资产治理仅支持停用可选治理项,不支持停用强治理项,并且不支持新建治理项。
配置治理单元(可选)。
DataWorks通常包含较多的工作空间,您可采用治理单元,按照业务划分,将一个或多个目标工作空间统一管理,集中统计该单元下所有工作空间的整体健康分、治理项问题及检查项事件。配置治理单元,详情请参见配置治理单元。
配置消息通知(可选)。
如果您希望将待解决的治理问题通过系统消息、邮件、钉钉群消息、Webhook等方式定期发送至指定人员,方便及时查看并处理,则可配置消息通知。配置详情,请参见通知设置。
启动检查并处理待治理问题。
任务发布前检测。
通过触发检查项进行检测。实现数据开发任务在发布前各环节,进行检查项触发检测、生成检查项事件、查看并处理检查项事件等主要流程,操作详情请参见处理检查项事件。
任务发布后检测。
通过触发治理项进行检测。实现数据开发在发布后,进行治理项触发检测、生成治理项问题、查看并处理治理项问题等主要流程,操作详情请参见处理治理工作项。
资产360专项检查。
您可通过资产360,对目标任务或表进行全方位查看并检测相关治理问题,精准完成任务或表的治理操作,详情请参见资产360。
物化视图自动化处理。
当您面对大数据计算任务频繁且存在大量相似子查询场景时,数据资产治理支持自动化治理,智能推荐物化视图,为您提供了一种智能化、自动化的解决方案。详情请参见物化视图。
选择分析视角。
基于使用场景:DataWorks提供数据生产、数据使用、数据管理等多维视角,助力您分析数据治理情况,高效进行数据治理工作。
基于合理利用资源的目的:DataWorks提供消费和任务运行情况、MaxCompute表的数量及存储情况、资源使用概况及明细,助力数据开发者及管理者查看和分析工作空间的整体资源情况,为合理使用整体资源做辅助判断。详情请参见资产分析。
查看治理成效。
待治理问题处理完成后,您可以进入数据资产治理的
页面,从不同视角查看已执行的治理操作所取得的治理成效。您可以通过分析治理结果,快速识别治理项问题较多的维度及问题类别,推动治理工作的解决落地,达成治理目标。数据资产治理是基于治理项,按照定义的健康分模型进行量化评估,最终通过治理评估报告及治理排行榜中的健康分来体现当前所取得的治理成效,健康分越高,治理成效越好。健康分相关内容,详情请参见量化评估:健康分。
量化评估:健康分
健康分是依据数据资产在数据生产、数据流通及数据管理中的用户行为、数据特性、任务性质等元数据,使用数据处理及机器学习等技术,对各类型数据进行综合处理和评估,通过个人、工作空间维度客观呈现数据资产状态的综合分值。在数据治理中,健康分体系依托不同元数据,建设了“存储、计算、研发、质量和安全”等五大健康度领域,并构建“存储健康分、计算健康分、研发健康分、质量健康分和安全健康分”五大健康分指标。
健康分的取值范围为0至100,分值越大表示数据资产的健康度越好,较高的健康度可以帮助您更放心、高效、稳定的使用数据,保障数据生产和业务运转。数据资产治理基于治理项,按照定义的健康分模型进行量化评估,最终通过健康分的形式来体现当前账号的治理成效,健康分越高,治理成效越好。数据治理评估等级和健康分的对应关系如下。
优秀:[90, 100]
良好:[75, 90)
及格:[60, 75)
需改进:[30, 60)
极差:[0, 30)
相关概念
检查项:检查项是作用于数据生产流程的主动式治理机制,可在数据开发任务运行、发布等关键环节进行前置检查,判断代码或数据是否存在潜在问题,如是否存在全表扫描、调度依赖配置是否缺失等。当检测到不符合要求内容时,会生成检查项事件,系统自动进行拦截处置,从而约束和管理开发流程,确保数据处理的标准化和规范化。
治理项:治理项指在数据治理过程中识别资产需要优化或解决的问题点,覆盖研发规范、数据质量、安全合规、资源使用率等方面的问题。治理项分为强治理项和可选治理项,前者默认开启且不可更改,后者则根据实际需求选择启用。例如,任务运行时间超长、连续出错节点、无人访问叶子节点等均为治理项。
治理项问题:治理项检测出的待治理优化问题。
治理单元:由一个或多个工作空间组成,用于集中统计指定工作空间的整体健康分、治理项问题和检查项事件。
数据治理计划:数据治理计划围绕不同治理场景提供治理计划模板,以周期时间内的治理目标为导向,快速选择强相关的治理项和检查项,圈定可优化对象,帮助负责人持续跟踪数据治理成效,通过量化评估,推动团队及时达成治理目标。
知识库:知识库包含数据资产治理内置的检查项及治理项定义,可帮助数据治理人员快速识别和了解治理过程中遇到的具体问题,并提供解决问题的参考信息和实践指导,提升人员治理效率。