空间监控

空间监控支持设备添加与管理,流状态、设备状态查询和实时流查看。同时支持录制回看,截图查看功能。可以对不正当内容的实时流进行禁推及恢复操作。流监控 操作步骤 登录 视图计算控制台,单击 空间监控。在 空间监控 页面,选择您要查看的...

应用场景

物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测和故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...

什么是用户体验监控

RUM)专注于对Web场景、App移动应用场景和小程序场景的监控,以用户体验为切入点,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

什么是视图计算

产品能力 视图计算产品将您的监控设备、智能设备通过标准化协议接入阿里云视图计算接入节点,在云端进行监控流的收录存储、媒体处理,通过CDN进行加速分发,供全网用户直接流畅播放实时监控流和历史监控流。提供接口方便监控内容对接视频...

如何排查设备SNMP监控异常?

背景信息 云网管支持对设备SNMP自定义采集,一般出现数据异常有以下原因:SNMP配置监控项信息有误,主要配置信息是SNMP版本,Community、采集周期和解析模板。SNMP监控项未部署到设备,如厂商或者型号未勾选。设备端SNMP Community配置错误...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

功能介绍

背景信息 在物联网边缘计算业务中,由边缘一体机分析的告警事件、设备故障等消息,需要及时发送通知给特定的人员处理,避免出现安全风险或者业务停滞等情况。对此场景,物联网边缘计算研发了 智慧立方 钉钉小程序,您只需要配置小程序,...

网络设备监控指南

说明 网络设备提供的协议方式,决定了网络设备监控的范围,具体参考如下:管理协议 提供信息 监控范围 ping 设备管理地址 设备联通性的监控,包括时延、丢包信息 snmp 设备管理地址、snmp community(确认设备snmp开启且配置)设备资产...

故障基础数据管理

故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障。对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...

通过IO HANG诊断并排查磁盘繁忙问题

监控中心,先选择目标主机,再单击 IO监控 页签,然后查看其监控指标 每分钟io hang次数 和 IO繁忙度 的监控图标。以下现象,说明IO HANG异常:每分钟io hang次数 大于1。在没有任何IO的情况下,IO繁忙度 持续100%。步骤二:发起诊断 ...

什么是应用实时监控服务ARMS?

专注于对Web场景、App移动应用场景和小程序场景的监控,以用户体验为切入点,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能...

监控设备连通性

本文主要介绍如何从零开始配置设备连通性(PING)监控的操作步骤。前提条件 开通云网管。操作步骤 步骤一:创建监控项,请参见 监控项管理。登录 云网管控制台。在控制台左侧菜单栏单击 网络监控>监控项管理。单击列表上方的 创建监控项 ...

运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

读多写少型业务场景多活实践

说明 基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。演练预期如下:导购链路对购物车应用是弱依赖(导购页会展示用户放入购物车的商品数量),弱依赖...

通过脚本录制断言特定业务逻辑的执行结果

您可以通过创建浏览器探测任务,模拟用户在不同地域、不同网络环境下通过浏览器访问探测目标,观测探测...对于错误的探测记录,您可以先单击其对应 操作 列的 详情,再在 详情分析 页面,单击 详细步骤 页签,查看具体操作步骤及其错误原因

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

如何配置流转规则

告警来源:触发事件&报警&故障 重要 以下规则仅适用监控源为:Prometheus/京东云云监控/阿里云云监控等 除业务监控外 的其他所有监控源。在 新增规则 页面,选择 触发规则的类型;选择 仅触发报警 需要配置 报警触发规则、优先级 和 默认...

如何使用Prometheus监控SNMP

本文介绍如何使用Prometheus监控SNMP。前提条件 已创建 容器服务类型的Prometheus实例,具体操作,请参见 Prometheus实例 for 容器服务。使用限制 目前仅Prometheus实例 for 容器服务类型实例支持该组件接入。SNMP简介 SNMP系统组成 SNMP...

故障协同处理(基于钉钉)

云钉运维故障协同效果 功能概述 移动应用端(目前仅支持“钉钉”,以下功能说明均基于钉钉场景)支持接收故障消息提示和进行故障操作,且支持移动端操作管理故障,操作记录实时同步到 运维事件中心 控制台。故障协同处理使用条件 成功开通...

如何使用Prometheus监控SNMP

本文介绍如何使用Prometheus监控SNMP。前提条件 已创建 容器服务类型的Prometheus实例,具体操作,请参见 Prometheus实例 for 容器服务。使用限制 目前仅Prometheus实例 for 容器服务类型实例支持该组件接入。SNMP简介 SNMP系统组成 SNMP...

概览

智能阈值报警是针对云监控中的云资源实例的监控指标推出的智能报警功能,它自动适配并拟合监控指标的历史数据,展示报警阈值边界,发现监控指标突增或突降的异常行为,为您业务的稳定性提供保障。什么是智能阈值 智能阈值基于机器学习算法...

2024年

指标说明 可观测监控 Prometheus 版 接入中心 新增 新版接入中心海外地域全面上线。通过接入中心接入数据 告警管理 告警事件 优化 应用监控告警事件详情支持传递自定义的应用标签。添加并使用标签 告警管理 告警屏蔽 优化 告警屏蔽操作支持...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

监控引擎

在左侧导航栏,选择 监控中心。说明 默认监控周期为当前时间之前的15分钟。单击右上角的时间周期下拉框,您可以选择其他时间周期,或者自定义时间周期作为监控周期。将光标悬停在数据图中的某个位置时,将显示节点指定时间(分钟粒度)的...

故障发现

7*24监控值班 对于有条件的企业,可以设立全球运行指挥中心(Global Operations Center,简称GOC),实现7*24监控值班,时刻关注核心业务线上异常与故障。对于完成监控覆盖的核心业务场景,在异常上报时,通过工具自动检测或值班人员人工...

基本概念

集成中心 名词概念 说明 监控监控源表示上游监控系统,包括阿里云监控系统、开源监控系统、其他云厂商监控系统、业界商业化监控系统。监控源产生的告警是整个报警、事件、故障的源头。集成接入 集成接入是将监控源跟运维事件中心数据...

资源消耗

您可以查看当前账号的网络分析与监控、基础云监控和企业云监控的资源消耗情况,还可以开通或关闭他们的按量付费,购买网络分析与监控和基础云监控的资源包。背景信息 关于网络分析与监控、基础云监控和企业云监控的计费方式和计费标准,请...

数据统计

您可以登录 视频直播控制台,在 数据中心 下的 计费用量、数据监控、访问统计 下的页面中查询对应数据。资源监控 可以监控流量带宽-上行、流量带宽-下行、回源带宽流量、HTTPCODE等数据。更多详情,请参见 资源监控。实时监控 可以监控推流...

怎么配置业务监控

应急衔接 若用户需要实现监控→应急的闭环,在新增监控项配置后,需要跳转【流转规则】,并完成业务监控的接入配置,才可以实现告警产生→报警/事件/故障产生的流程闭环。具体流转规则配置,参见文档:【如何配置流转规则】

自治服务概述

云数据库 OceanBase 的自治服务是一款面向开发、运维、DBA 的一站式智能诊断自治服务,为用户提供可视化监控、性能优化、故障诊断、安全管理、容量管理等能力,帮助用户更简单、更低成本、更高性能的使用 OceanBase 数据库。背景信息 传统...

什么是云拨测

故障定位与诊断:云拨测利用先进的Traceroute诊断技术,快速发现并定位网络故障,提供详细的故障报告和解决建议。实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,会主动发送告警通知,快速响应并处理问题。数据可视化:通过...

核心文件监控

核心文件监控功能可以实时监控服务器上核心文件的访问情况,对文件的访问、修改、删除、重命名等操作进行实时监控和告警,可监控核心文件是否被盗取或篡改。本文介绍如何实现对服务器核心文件访问的监控。使用限制 仅云安全中心的企业版和...

前端监控场景

主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。业务痛点 定位性能瓶颈困难 当用户反馈页面...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
视频点播 视频直播 视图计算 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用