监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

数据质量:全流程质量监控

DataWorks的全流程数据质量监控功能为您提供35种预设表级别、字段级别和自定义的监控模板。数据质量帮助您第一时间感知到源端数据的变更与ETL(Extract Transformation Load)中产生的脏数据,自动拦截问题任务,有效阻断脏数据向下游蔓延...

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

资产质量概述

数据质量的功能包括质量规则配置、质量监控、调度配置、智能报警、校验治理等。前提条件 已购买资产质量增值服务,详情请参见 开通Dataphin。背景信息 面对各行各业日趋强烈的大数据建设、管理及应用的诉求,Dataphin应用场景的多样性及...

资产质量概述

数据质量的功能包括质量规则配置、质量监控、调度配置、智能报警、校验治理等。前提条件 已购买资产质量增值服务并且当前租户已开通资产质量模块。背景信息 面对各行各业日趋强烈的大数据建设、管理及应用的诉求,Dataphin应用场景的多样性...

什么是故障演练

流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的流程,覆盖用户从计划到还原的完整演练过程,并通过可视化的方式清晰的呈现给用户。适用场景 故障演练可适用于以下典型场景:衡量微服务...

故障应急

故障管理体系是围绕故障全生命周期采取的一系列控制流程,包括故障基础数据管理(故障等级定义、应急场景监控覆盖、服务组&值班表管理、故障订阅管理),故障发现(7*24监控值班、智能基线告警),故障应急协同(故障通告及更新、故障应急...

什么是应用高可用服务AHAS

流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的流程,覆盖用户从计划到还原的完整演练过程,并通过可视化的方式清晰的呈现给用户。适用场景 故障演练可适用于以下典型场景:衡量微服务...

配置数据质量监控

基于用户画像分析加工流程,汇总质量监控规则如下:表名 需求明细 ods_raw_log_d 对每日同步的原始日志数据进行表数据非0监控,避免后续无效加工,及时止损。ods_user_info_d 对每日同步的用户信息数据进行表行数非0校验(强规则)和业务...

配置数据质量监控

基于用户画像分析加工流程,汇总质量监控规则如下:表名 需求明细 ods_raw_log_d 对每日同步的原始日志数据进行表数据非0监控,避免后续无效加工,及时止损。ods_user_info_d 对每日同步的用户信息数据进行表行数非0校验(强规则)和业务...

数据质量规则配置流程

本文为您介绍数据质量监控规则的配置流程及生效逻辑,以及规则列表的相关操作。规则配置流程 您可基于表配置单个表的数据质量监控规则,也可基于模板,批量配置多个表的数据质量监控规则,具体如下。基于表配置数据质量监控规则(单个配置...

服务监控概述

完成模型开发和部署后,您可以在多方安全建模控制台,配置模型服务的监控采集规则。节点中内置了采集统计值模块,可以在不泄露原始数据的前提下,向控制台...服务监控流程如下:各流程的详细配置请参见以下文档:配置监控信息 查看报表信息

监控、诊断和故障排除

故障排除:提供常见的问题场景和故障排除方法。服务监控 监视总体运行状况 可用性和有效请求率 可用性和有效请求率是有关系统稳定性和用户是否正确使用系统的最重要指标,指标小于100%说明某些请求失败。可能因为一些系统优化因素出现暂时...

06物理表质量监控明细

物理表监控明细为您展示物理表的质量监控报告详情,包含质量评分、质量评分规则统计、表质量评分详情、字段质量详情,通过查看物理表维度最新质量评估结果,方便研发运维人员第一时间发现并定位物理表质量问题。本文介绍如何查看物理表监控...

故障处理流程

SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下流程排查故障:用户收到告警信息或者发现应用不可用。登录智能接入网关控制台,查看设备状态。访问其他公共网站,查看运营商网络状态。硬件排查。查看安全组规则...

数据质量管理流程

本文为您介绍数据质量管理概念、数据管理流程。数据质量管理是通过划分数据资产等级和分析元数据的应用链路,对不同资产等级的数据采取相对应的质量管理方式。数据质量管理流程图如下。数据管理流程说明如下:分析业务场景,根据应用的影响...

什么是管理控制台

在进行删除、重启等高风险的操作时,触发风险控制流程,全面保证登录和操作的安全性。核心功能 管理控制台的核心功能主要包括但不限于:管理云账号和基础安全设置。获取在阿里云消费的所有账单信息,管理发票、合同等财资业务。全面使用和...

操作流程

新建数据元 通过新建数据元,配置数据元的类型、长度、质量校验函数和引用数据字典,为模型标准化设计及数据治理过程中的质量监控提供规则依据。具体操作,请参见 新建数据元。采用维度+指标的数据标准管理 通常使用维度建模方式创建的数仓...

操作流程

新建数据元 通过新建数据元,配置数据元的类型、长度、质量校验函数和引用数据字典,为模型标准化设计及数据治理过程中的质量监控提供规则依据。具体操作,请参见 新建数据元。采用维度+指标的数据标准管理 通常使用维度建模方式创建的数仓...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

设备显示离线

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第二个和第三个灯是否为...

ping不通云服务ECS(SAG-1000)

如果是静态路由接入,尝试通过交换机,能否ping通设备的每个接口IP,如果其中有无法ping通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否有红色的。...

应用场景

一站式运维事件管理 应用场景 满足各类监控场景下报警统一事件化管理需求,支持集成对接各监控系统,支持服务器自定义推送异常事件,对报警、事件、故障进行全流程一站式管理,提升企业运维效率。能够解决 多源监控集成:支持多个常见监控...

数据质量管理流程

数据质量的管理流程包括业务数据资产定级、加工卡点、风险点监控和及时性监控,您可以构建属于自己的数据质量保障体系。数据质量管理的流程图如下。数据质量管理的流程说明如下:分析业务场景,对数据流转链路上的整个依赖关系,进行资产...

数据质量管理流程

数据质量的管理流程包括业务数据资产定级、加工卡点、风险点监控和及时性监控,您可以构建属于自己的数据质量保障体系。数据质量管理的流程图如下。数据质量管理的流程说明如下:分析业务场景,对数据流转链路上的整个依赖关系,进行资产...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

产品正式商业化发布

产品适用场景 一站式运维事件管理:满足各类监控场景下报警统一事件化管理需求,支持集成对接各监控系统,支持服务器自定义推送异常事件,对报警、事件、故障进行全流程一站式管理,提升企业运维效率。体系化故障闭环管理:基于阿里多年...

故障注入

功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控台 MS 拼接故障注入规则,将其发送到 DRM。MOSN 和 RPC 客户端订阅 DRM 的 Key 值。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格...

数据质量衡量

在了解保障基于MaxCompute的数据仓库数据质量的方案后,您还需要进一步学习如何制定一套标准度量方案,以及判断质量监控方案是否合适业务需求以及如何改进。例如,针对每一个数据质量事件,必须分析原因和处理过程,制定后续同类事件预防...

操作流程

通过操作流程图及说明,您可以...查看物理表监控明细 通过查看物理表的质量监控报告详情的最新质量评估结果,包含表质量评分详情、字段质量详情等,方便研发运维人员第一时间发现并定位物理表质量问题。具体操作,请参见 查看物理表监控明细。

操作流程

通过操作流程图及说明,您可以...查看物理表监控明细 通过查看物理表的质量监控报告详情的最新质量评估结果,包含表质量评分详情、字段质量详情等,方便研发运维人员第一时间发现并定位物理表质量问题。具体操作,请参见 查看物理表监控明细。

功能特性

当风险事件发生时,风险事件中心会推荐可执行的应急预案,供运维快速选择并自动化执行,从而通过标准化处理流程,实现故障快速恢复。故障演练 故障演练 提供了故障注入能力,通过演练平台主动触发故障,以此观测应用软件的高可用性。故障...

EMR Kafka ECS磁盘事件处理

如果ECS修复磁盘事件流程中,要求重启ECS,则可以按照如下步骤重启:在EMR控制台停止故障Broker节点服务。重启故障ECS实例。在ECS修复磁盘事件流程中,单击 重启。在EMR控制台启动故障Broker节点服务。观察Broker节点状态是否处于正常状态...

故障演练

故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的应用可以在容灾站点正常拉起。确保操作人员熟悉容灾恢复流程,确保在生成站点真正...

故障演练

故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的应用可以在容灾站点正常拉起。确保操作人员熟悉容灾恢复流程,确保在生成站点真正...

查看并管理治理工作台

若选择永久,建议调整质量监控配置。操作说明 必填项,请填写加入白名单的原因。发起整改 参数 描述 整改范围 支持 当前规则 和 监控对象。当前规则:只会针对当前选择的规则进行整改。监控对象:对所选规则对应的监控对象下的所有异常发起...

查看并管理治理工作台

若选择永久,建议调整质量监控配置。操作说明 必填项,请填写加入白名单的原因。发起整改 参数 描述 整改范围 支持 当前规则 和 监控对象。当前规则:只会针对当前选择的规则进行整改。监控对象:对所选规则对应的监控对象下的所有异常发起...

监控指标

如果您需要了解流程执行情况的统计指标,您可以登录 云监控控制台 查看。目前已提供的指标在流程维度按分钟聚合,描述某地域某个流程的执行情况。具体指标如下。指标名称 单位 指标说明 流程启动次数 count/min 描述一分钟内某个流程的启动...

功能优势

灵活的流程编排 AHAS Chaos 将故障演练的环节分为了准备、注入、检查以及恢复四个阶段,每个阶段除了系统初始化完成的必要节点之外,您也可以根据需要添加所需的流程节点。AHAS Chaos 支持一次演练包含多个定义的故障场景,同时您可以定制...

配置集成管道质量监控

通过离线集成管道质量监控,Dataphin会自动为您监控数据表的质量,如果数据表有质量风险,系统会自动报警,通知告警接收人,帮助您及时了解数据表质量状况。本文为您介绍如何配置质量规则。权限说明 项目开发者支持创建集成任务、配置质量...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 轻量应用服务器 负载均衡 Node.js 性能平台 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用