监控、诊断和故障排除

故障排除:提供常见的问题场景和故障排除方法。服务监控 监视总体运行状况 可用性和有效请求率 可用性和有效请求率是有关系统稳定性和用户是否正确使用系统的最重要指标,指标小于100%说明某些请求失败。可能因为一些系统优化因素出现暂时...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

【2020年5月3日】DigiCert系统定期维护通知

尊敬的阿里云用户:接Digicert通知,Digicert将在北京时间2020年5月3日15:00~17:00对系统进行定期维护。尽管Digicert已制定了预案来保障您服务的正常运行,但在此期间您的某些DigiCert服务可能无法使用。Digicert将尽快恢复服务的正常访问...

故障基础数据管理

故障订阅管理 故障通告订阅是用来维护故障通告接收对象,可根据不同的条件发送不同的渠道。故障订阅可以分为3种类型的对象:个人、干系人角色、钉钉群或其他通知渠道。通过合理的配置故障通告和订阅,能够确保相关干系人及时收到告警。

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

背景信息以及准备工作

在进行故障排除、状态监控或者预测告警时,都需要对日志文件进行查询分析。阿里云对象存储服务OSS(Object Storage Service),是阿里云提供的海量、安全、低成本、高可靠的云存储服务。越来越多的用户倾向于把大量的日志文件存储在OSS中,...

维护定期回收空间任务

对于系统表(包括pg_class,pg_attribute,pg_index等),当有频繁建删表,建删索引等操作时,也建议执行 VACUUM FULL进行定期维护。注意:该操作需要业务停止访问数据库。频率:至少每周执行一次。如果每天会更新几乎所有数据,需要每天做...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

I-V曲线诊断

光伏阵列故障状态说明 光伏智能运维需要定期检查和维护光伏阵列,光伏阵列故障相关说明如下。光伏阵列部分遮挡 光伏阵列在发电过程中受到外界因素的干扰出现部分遮挡,是光伏发电中一种常见的故障类型,其示意图如下所示。当出现部分遮挡时...

关停或启动网站站点

网站完成维护或者故障排查后,需要您再次启动网站站点,确保网站恢复正常运行。本文为您介绍关停或启动网站站点的方法。背景信息 网站的运行状态包括 运行中 和的 已停止 两种状态。运行中:表示站点正常运行中,网站页面可以正常访问。已...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

设备显示离线

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第二个和第三个灯是否为...

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

ping不通云服务ECS(SAG-1000)

如果是静态路由接入,尝试通过交换机,能否ping通设备的每个接口IP,如果其中有无法ping通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否有红色的。...

基本概念

故障管理 网络故障的发现、分析、定位等维护管理,包括告警信息的收集入库、规则匹配、关联分析以及告警清除等一系列流式处理过程。Netconf netconf协议一般用于网络业务配置,使用结构化可描述语言实现快速的网络设备下发。gRPC 高性能、...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

跨地域容灾

步骤四:故障切换 定期的容灾演练保证了您的业务可以随时在云上启动。而当您的主站发生重大故障,需要在云上马上重启核心业务时,则需要进行故障切换操作。警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作会停掉...

实时分析链路数据

如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

跨地域容灾

步骤四:故障切换 定期的容灾演练保证了您的业务可以随时在云上拉起。而当您的主站发生重大故障,需要在云上马上重启核心业务时,就需要进行故障切换操作了。警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作会停掉...

支持计划

配置指导以及故障排除 配置指导以及故障排除 配置指导以及故障排除 专属技术服务经理 不支持 不支持 专属技术服务经理(TAM)健康检查 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor。专属技术服务经理...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

运维服务内容说明

IDC和硬件设备维护,如网络设备、服务器、存储等硬件巡检、更换、诊断等。注:对于不在服务范围内的第三方应用软件问题,客户需联系相应供应商提供技术支持。3.前提条件 客户应提前至少15个自然日申请该服务,以便于阿里云工程师评估可运维...

修改实例维护属性

当宿主机存在故障风险和出现突发故障时,阿里云会通过系统事件方式通知宿主机上的用户,您可以响应该系统事件。在您响应该系统事件时,ECS实例的默认行为是自动重启。如果您希望在这种情况下不自动重启ECS实例,可以通过修改维护属性来调整...

应用场景

通过温度传感器对整个风机的温度测点进行实时监控,并对海量温度数据进行深度学习,构建风机故障检测与感知预测模型,最终做到提前1-2周识别风机微小故障并预警,单台风机单次重大事件维护成本大大降低。生产工艺优化 您可以使用工业大脑...

ADP底座介绍

ADP底座包含了两个部分:ADP容器底座:整个应用运行时的公共底座,是一个K8s为基础的容器云平台,他是应用自有组件和中间件的部署、运维的基础设施,为上层业务应用的运行和管理维护提供必要的系统支持。ADP-Local:跟随软件产品交付部署到...

产品简介

什么是运维事件中心 运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能;一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应...

GxP欧盟附录11标准合规包

他要求涵盖了计算机化系统的开发、验证、操作、维护和监测等方面,以确保这些系统符合相关法规和标准,用于生产、控制和保证产品质量和可靠性。Annex 11是GMP(Good Manufacturing Practice)的一部分,作为药品生产过程中的重要指导标准之...

归档存储服务等级协议

故障恢复能力 阿里云为付费用户的云服务提供7×24小时的运行维护,并以在线工单和电话报障等方式提供技术支持,具备完善的故障监控、自动告警、快速定位、快速恢复等一系列故障应急响应机制。2.11.网络接入性能 阿里云归档存储对用户不限制...

设置可维护窗口

背景信息 在阿里云平台上,为保障 云原生数据库PolarDB 的稳定性,后端系统会不定期对集群进行维护操作,确保集群平稳运行。您可以根据业务规律,将可维护窗口设置在业务低峰期,以免维护过程中对业务造成影响。注意事项 在进行正式维护前...

设置可维护窗口

背景信息 在阿里云平台上,为保障 云原生数据库PolarDB 的稳定性,后端系统会不定期对集群进行维护操作,确保集群平稳运行。您可以根据业务规律,将可维护窗口设置在业务低峰期,以免维护过程中对业务造成影响。注意事项 在进行正式维护前...

设置可维护窗口

背景信息 在阿里云平台上,为保障 云原生数据库PolarDB 的稳定性,后端系统会不定期对集群进行维护操作,确保集群平稳运行。您可以根据业务规律,将可维护窗口设置在业务低峰期,以免维护过程中对业务造成影响。注意事项 在进行正式维护前...

设置可维护时间段

为保障 云原生多模数据库 Lindorm 实例的稳定性,阿里云会不定期对实例进行维护操作。可维护时间段是指您允许阿里云进行维护操作的时间段。建议您将维护时间段设置在业务低峰期,以避免维护过程中可能对业务造成的影响。使用限制 不支持...

设置可维护时间段

为保障云数据库RDS实例的稳定性,后端系统会不定期对实例进行维护操作。默认可维护时间段为02:00~06:00,您可以根据业务规律,将可维护时间段设置在业务低峰期,以免维护过程中可能对业务造成的影响。注意事项 在进行正式维护前,RDS会给...

设置可维护时间段

为保障 私有定制RDS 实例的稳定性,后端系统会不定期对实例进行维护操作。您可以根据业务规律,将可维护时间段设置在业务低峰期,以免维护过程中可能对业务造成的影响。注意事项 实例维护当天,为保障整个维护过程的稳定性,实例会在可维护...

设置可维护时间段

为保障云数据库专属集群MyBase实例的稳定性,后端系统会不定期对实例进行维护操作。默认可维护时间段为02:00~06:00,您可以根据业务规律,将可维护时间段设置在业务低峰期,以免维护过程中可能对业务造成的影响。注意事项 在进行正式维护前...

设置可维护时间段

为提高阿里云Elasticsearch(简称ES)实例的稳定性,后端系统会不定期对实例进行维护。可维护时间段是指您允许阿里云进行维护操作的时间段,默认可维护时间段为02:00~06:00。您可以根据业务规律,将可维护时间段设置在业务低峰期,以降低...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网平台 数据库自治服务 数据库审计 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用