故障管理

系统软件故障:包括操作系统死机、数据库的各类故障。硬件故障:包括硬盘、网卡损坏。相关设备故障:包括UPS失效引起的电力中断。自然灾害,包括洪水、火灾、地震。这里以阿里集团为例。为降低故障的影响,阿里集团故障管理体系从整体体系...

功能特性

故障演练 故障演练 提供了故障注入能力,通过演练平台主动触发故障,以此观测应用软件的高可用性。故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

灾备规划

云上容灾 为减少因应用故障导致的业务损失,当数据中心出现严重故障无法快速恢复时,混合云容灾服务可以高效地在ECS上快速恢复您的应用。RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

异地应用双活切流

说明 用户应用出现故障,将故障应用对应的单元(地域)流量切0,由正常单元(地域)承担全部流量。a.选择 故障单元,代表此时,该单元当前出现故障,无法承接流量,MSHA会自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入...

混合云应用双活容灾最佳实践

步骤二:应用故障注入 这里使用阿里云故障演练产品,对阿里云-北京地域的商品应用注入故障。登录 AHAS控制台。在左侧导航栏选择 故障演练>我的空间,并在顶部选择地域。在 我的空间 页面搜索配置好的演练(50%概率网络丢包),然后在该演练...

常见问题

运维操作问题 如何获取常用的应用软件管理命令?由于挖矿程序导致服务器CPU异常占用,如何处理?服务器无法访问GitHub是什么原因?如何隐藏Windows系统中的IIS版本信息?在Ubuntu服务器中提示“The following signatures were invalid:...

故障演练

并且有个规律,硬件故障的现象,会在软件故障现象上有所体现。故障隶属于单机或是分布式系统之一,分布式故障包含单机故障。对于单机或同机型的故障,以系统为视角,故障可能是当前进程内的故障,比如:如FullGC,CPU飙高;进程外的故障,...

实例健康诊断

实例健康诊断功能可以对 轻量应用服务器 实例的计算服务状态、网络服务、存储服务和配置管理等进行全方位的诊断,帮助您了解实例的健康状态,及时发现并解决常见的问题。前提条件 轻量应用服务器...轻量应用服务器故障问题,请参见 故障排除

3.创建应用

​ IDaaS 中预集成了一系列常用企业软件应用模板,进行了深度配置优化,可一键添加,配置简单。说明 对于市面上其他应用和自研应用,可以使用【标准协议】和【自研应用】模板进行接入。【阿里云用户 SSO】应用是市场中的第一个,点击添加...

监控、诊断和故障排除

故障排除:提供常见的问题场景和故障排除方法。服务监控 监视总体运行状况 可用性和有效请求率 可用性和有效请求率是有关系统稳定性和用户是否正确使用系统的最重要指标,指标小于100%说明某些请求失败。可能因为一些系统优化因素出现暂时...

支持计划

配置指导以及故障排除 配置指导以及故障排除 配置指导以及故障排除 专属技术服务经理 不支持 不支持 专属技术服务经理(TAM)健康检查 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor。专属技术服务经理...

基本概念

概念 描述 故障转移(Fail Over)即容灾恢复,指您的 IDC 应用出现故障时,在阿里云上恢复应用的过程。故障恢复(Fail Back)当您的 IDC 内的环境恢复以后,将应用数据迁回自有 IDC 恢复应用运行的过程。RPO Recovery Point Objective(数据...

远程连接FAQ

排除本地网络故障后再进行后续的排查。如果是本地运营商网络问题,建议您联系运营商解决。检查服务器的负载是否过高 轻量应用服务器的带宽和CPU使用率过高,可能会导致服务器无法远程登录。如果是带宽或CPU占用过高导致的无法登录,请参考...

设计方案

基于稳定性支柱设计原则,整体稳定性设计方案可参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量级的通信机制...

快速体验ADP

预估产品在部署后的可靠性,及早发现并排除交付隐患 利用1台或多台服务器,一键搭建稳定可靠的Kubernetes集群,并部署运行自己的业务应用 通过本地运维控制台,对部署完成的产品进行可视化的监控、配置告警通知、故障分析诊断等运维管理 2....

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。完整的故障演练...

安装探针概述

为您的主机等资源安装应用高可用探针后,即可使用AHAS架构感知和故障演练功能,能直观地看到应用对基础架构的依赖关系、组件间的依赖关系,以及对指定机器进行故障演练。接入 AHAS架构感知和故障演练可以接入云服务器ECS、自建Kubernetes、...

监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

接入主机

在普通主机上安装AHAS探针后,即可体验架构感知和故障演练功能,直观地查看应用对基础架构的依赖关系,组件间的依赖关系,以及对应用进行故障演练。本文介绍如何将探针接入主机,主机类型包括Linux和Windows。操作步骤 登录 AHAS控制台,并...

接入ECS

AHAS架构感知和故障演练支持在ECS上一键安装应用高可用探针。安装成功后,您可以直观地查看应用对基础架构的依赖关系,组件间的依赖关系,以及对应用进行故障演练。本文介绍如何快速接入ECS。前提条件 确保待安装探针的ECS系统为Linux或...

服务治理概述

部署和运维 EDAS多语言互通 查询多语言应用服务 为多语言应用配置故障注入 安全和可用性 使用服务鉴权实现多语言应用的访问控制 使用离群实例摘除保障多语言应用的可用性.aliware-toc-container.list-item{ white-space:normal;}

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 ...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控...

服务管控和治理

故障注入 您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。更多信息,请参见 故障注入。服务鉴权 服务提供者提供服务后,您可以通过...

读多写少型业务场景多活实践

导购链路对商品应用是强依赖,强依赖故障将导致业务不可用,因此故障的爆炸半径应该控制在单元内。创建故障演练。创建杭州单元商品中心故障的演练,具体操作,请参见 创建演练。故障注入。在多活容灾的 监控大盘 页面 异地双活 区域,查看...

如何在轻量应用服务器中安装应用软件

概述 本文主要介绍如何在轻量应用服务器中安装应用软件。详细信息 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、RDS)等进行配置与数据修改,...

事件中心

事件中心将云产品所生成的事件数据进行统一管理、存储、分析和展示,已接入EDAS的变更事件、ARMS的报警事件、0-1事件(如死锁、OOM和应用启动等)、MSE的微服务管控事件和K8s集群事件。当您的应用使用了相关的产品,对应的事件会自动接入...

事件中心

事件中心将云产品所生成的事件数据进行统一管理、存储、分析和展示,已接入EDAS的变更事件、ARMS的报警事件、0-1事件(如死锁、OOM和应用启动等)、MSE的微服务管控事件和K8s集群事件。当您的应用使用了相关的产品,对应的事件会自动接入...

功能发布记录(2018~2022年)

优化 选择注册中心运维方式 支持为多语言应用配置故障注入 通过给应用注入特定故障,来检测该应用的消费者处理异常情况的能力。新增 已下线 支持为多语言应用配置服务超时 服务超时机制可以在请求的处理时间超过设置的时间时直接返回错误...

运维服务内容说明

注:对于不在服务范围内的第三方应用软件问题,客户需联系相应供应商提供技术支持。3.前提条件 客户应提前至少15个自然日申请该服务,以便于阿里云工程师评估可运维性,确认是否承接该服务申请。如购买驻场服务,客户应在服务开始时提供...

什么是混合云容灾服务

解决的核心问题 混合云容灾解决的核心问题如下:应用级容灾保障业务持续性(Business Continuity):在数据中心故障或长时间系统维护作业时,在云上快速恢复应用运行,缩短业务停机时间,极大减少损失。数据级容灾:在数据中心备份您的数据...

部署PHP ZIP应用至SAE

说明 可以通过修改PACKAGE_NAME值,管理不同应用软件包名避免冲突。仅支持打包为ZIP格式。如果有更多目录需要打包,可修改 zip-r 命令添加目录或文件。安装打包软件 apt-get update apt-get install zip-y#定义软件包名称 PACKAGE_NAME=...

搭建LAMP开发环境(通过应用镜像)

本文将介绍如何使用轻量应用服务器的LAMP镜像快速搭建开发环境。背景信息 阿里云的 云市场 提供了丰富的镜像资源,集成了操作系统和应用程序。在创建实例时,选择包含了LAMP环境的镜像,创建后就无需再部署环境。使用LAMP环境云市场镜像的...

使用云效2020部署Java应用至ECS集群

软件包 选择 步骤四:配置流水线 中 步骤1 中构建物上传(EDAS/SAE使用)步骤所创建的产出物名称。发布批次 选择批次数量来表示发布分批的数量。分批等待时间 相邻发布批次之间的等待时间。分批方式 可选择 手动确认 或 自动确认。例如,...

使用云效2020部署Java应用至ECS集群

软件包 选择 步骤四:配置流水线 中 步骤1 中构建物上传(EDAS/SAE使用)步骤所创建的产出物名称。发布批次 选择批次数量来表示发布分批的数量。分批等待时间 相邻发布批次之间的等待时间。分批方式 可选择 手动确认 或 自动确认。例如,...

云原生应用交付平台支持被审计的事件说明

云原生应用交付平台已与操作审计服务集成,您可以在操作审计中查询用户操作云原生应用交付平台产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中,满足实时审计、问题回溯分析等需求。操作审计...

设计原则

面向失败的架构设计原则 众所周知,系统异常事件是不可避免的,如网络延迟、硬件故障软件错误、突峰流量等,建议在系统设计阶段就要从这些异常事件引起的系统执行“失败”出发,提供冗余、隔离、降级、弹性等能力,旨在确保系统的高可用...

放行WAF回源IP段

适用场景 CNAME接入 方式下,如果您的源站服务器上使用了安全狗、云锁等安全软件应用了特定的访问控制策略,您必须在源站设置放行 WAF回源IP段,避免由WAF转发回源站服务器的正常流量被误判断为异常攻击而被拦截,影响Web业务正常访问。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
域名 Web应用防火墙 云数据库 RDS 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用