监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

健康检查

概述 开启健康检查是指对地址池中的IP地址配置健康检查,开启后可实现实时监测应用服务的可用性状态,并最终帮助企业实现自动故障隔离和自动故障切换的功效。健康检查的类型,包括:ping监控、tcp监控、http(s)监控的配置相关。前提条件 已...

使用云效流水线自动创建资源栈

您可以通过云效流水线,使用ROS模块自动创建资源栈。本文以更新一个包含专有网络的ECS为例,为您介绍使用云效流水线自动创建、更新资源栈的方法。前提条件 您需要创建服务角色,并对角色进行授权。请确保您已创建服务角色(例如:...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

开启健康检查

开启健康检查是指对地址池中的地址配置健康检查策略,开启后可监测应用服务的可用性状态,并最终帮助企业实现自动故障隔离和自动故障切换的功效。健康检查的类型包括:Ping监控、TCP监控、HTTP(S)监控。前提条件 已完成 创建实例、创建...

智能负载均衡

能力 未启用智能负载均衡 启用智能负载均衡 容灾能力 多节点单活的接入防护能力 统一容灾切换 基于多节点负载均衡的接入防护能力 基于智能DNS的自动网络故障容灾切换 访问加速 无 就近接入防护及就近回源的最短链路 智能负载均衡的价值 ...

产品系列概述

高可用系列 一主一备的高可用架构,支持自动故障切换。备节点不可访问。支持增加 只读实例 扩展读能力。大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。集群系列 一主多备的高可用架构,支持自动故障切换。...

主备方案介绍

故障自动容错:主备双活功能提供故障自动容错能力,在故障场景下可以自动进行主备节点切换。通常需要进行主备集群切换的场景如下:机房出现断网断电等故障。无法正常连接主集群,请求全部报错。由于软件Bug导致全集群宕机。由于慢盘或者坏...

自动故障剔除

自动故障剔除功能会自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

智能负载均衡

功能项 未启用智能负载均衡 启用智能负载均衡 容灾能力 多节点单活的接入防护能力 统一容灾切换 基于多节点负载均衡的接入防护能力 基于智能DNS的自动网络故障容灾切换 访问加速 无 就近接入防护及就近回源的最短链路 业务价值 对于各类...

ZooKeeper的使用场景和MSE ZooKeeper的优势

节点故障自愈:依托于K8s的Liveness能力,在节点出现故障时,会自动恢复故障节点,及时地保障服务的可持续性。数据安全:MSE ZooKeeper专业版提供了快照的备份能力,在集群出现非预期的情况时,能够快速重建恢复集群中的数据,保障数据的...

容灾恢复

集群中通常一个服务有多个服务提供者,其中部分服务提供者可能由于网络、配置、长时间 fullgc、线程池满、硬件故障等导致长连接还存活但是程序已经无法正常响应。单机故障剔除功能会将这部分异常的服务提供者进行降级,使客户端的请求更多...

自动故障转移和读写分离

使用PostgreSQL的libpq或JDBC,您可以通过简单的配置实现自动故障转移(failover)和读写分离。背景信息 从PostgreSQL 10开始,libpq驱动层开始支持简单的故障转移,JDBC驱动层则支持简单的故障转移和负载均衡。libpq是PostgreSQL的C应用...

产品优势

简单易用 服务开箱即用:支持即开即用的方式,购买之后即可使用,方便业务快速部署。兼容开源 Memcache:兼容 Memcache binary protocol,符合该协议的客户端(binary ...硬件故障自动检测与恢复:自动侦测硬件故障并在数秒内切换,恢复服务。

PostgreSQL只读实例简介

云盘实例的只读实例为单节点架构,没有备节点,因此无法保障可用性,建议您购买多个只读实例,使用libpq或JDBC实现自动故障转移,详情请参见 自动故障转移和读写分离。您也可以通过数据库代理实现读写自动分离,更多信息,请参见 什么是...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

测试体系

由于是使用线上流量做测试,可以保证用例的丰富性和真实性,更容易发现传统测试容易遗漏的缺陷,节省人力成本同时,有效避免线故障。双引擎自动回归平台(简称双引擎或者doom)是一个将线上真实流量复制并用于自动回归测试的平台。通过...

搭建高可用架构

MySQL:RDS MySQL集群版实例采用计算与存储分离、一主多备的架构,支持自动故障切换、任意备节点可切换为主节点、备节点可读、按需增删节点、多可用区容灾、节点粒度的监控、集群节点拓扑管理等功能,同时还可启用MGR保障RPO=0,相比自建...

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...

冷数据归档

冷数据的判定标准如下:当前时间-数据的时间戳>=冷热分界线(天)设置冷热分界线的方法 有以下两个方式设置冷热分界线:通过SQL语句在Database的创建或修改中设置冷热分界线。说明 通过SQL设置冷热分界线的方法可参见 CREATE DATABASE 或 ...

产品优势

支持高可用实例、节点故障自动切换,保障业务连续性;提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,免去繁琐的运维烦恼。低构建成本、灵活计费、满足不同成本需求 产品构建、运维成本,仅为国外其他图数据库云厂商的 40%...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地...

如何配置流转规则

升级规则:可配置故障自动升级规则。当故障持续时长达到一定长度,立即触发自动升级策略。如 P3 故障持续 60分钟未解决 后,自动升级至 P2。故障升级仅支持逐级上升,不可跨级上升。业务监控来源:触发事件&报警&故障 重要 以下规则 仅适用...

FAQs

重要 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;DNS切换同步时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL缓存设置以及网络环境不同,所以全网生效时间...

访问策略

访问策略包括DNS智能解析、默认地址池/备用地址池、生效地址池切换策略等相关信息,一个GTM实例可以创建多个访问策略,可为不同网络或区域来源的访问用户设置不同的解析响应地址池,并最终实现用户就近访问接入和故障自动切换的效果。...

什么是全局流量管理?

故障切换:指当健康检查结果发现用户访问的默认地址池出现整体不可用时,系统会自动把用户访问流量切换到备用地址上,可确保应用服务地址故障时,能够用备用地址池来响应用户的DNS查询请求,从而实现降低业务中断的风险,保障业务的稳定...

常见问题-FAQ

GTM是集成了DNS的智能解析功能、云监控的应用服务监控功能,为客户输出不同网络或地区用户访问实现就近接入、应用服务运行状态的健康检查、故障自动切换等能力。全局流量管理(GTM)的CNAME接入域名是否能直接通过URL访问?答:不可以使用 ...

故障协同处理(基于钉钉)

故障场景群包含以下三部分功能:(1)消息卡片自动推送:场景群创建成功后,群机器人自动推送 故障处理中 消息卡片,卡片包含 签到、签到记录、时间线、应急作战室 按钮,其中时间线可跳转故障H5详情的时间线界面。群机器人同时自动推送群 ...

网络架构容灾

当地址池中地址发生故障时,HealthCheck模块会准确的检测到异常情况并与DNS交互(如下图中序号3所示),摘除故障地址(如下图中序号4所示),这样用户端会自动解析到可用的地址池(如下图中序号5所示)。并当故障地址恢复时,自动恢复至...

三网合一卡2.0使用入门

步骤四:验证重启是否切网成功 设备手工重启后自动切换网络,查看运营商信息是否更新 步骤五:验证网络故障设备自动重启切网 登录阿里云控制台,对当前使用的运营商卡片进行停机操作,模拟断网场景,在 步骤二 的基础上等触发检测后,设备...

节点弹性大盘

随着集群规模扩大和频繁自动伸缩弹性,仅凭人工手动方式很难快速定位及发现问题,也很难追溯历史,基本不可能发现在长时间线上统计才能发现的异常。本文介绍如何通过节点弹性大盘上展示的Pod、Node详情及变化图表,快速排查定位问题。前提...

EMR Kafka磁盘故障运维

磁盘故障及其运维通常伴随着磁盘上的数据销毁。在进行磁盘运维时,您应考虑数据是否需要迁移备份。对于Kafka集群,您还需要考虑Topic分区副本数据是否可以从其他Broker节点分区副本同步恢复。本文以EMR Kafka 2.4.1版本为例,介绍Kafka磁盘...

产品架构

业务背景 伴随着信息技术的飞速发展,各行各业在业务生产中产生的数据种类越来越多,有结构化的业务元数据、业务运行数据、设备或者系统的量测数据,也有结构化的业务运行数据、日志、图片或者文件等。按照传统方案,为了满足多种类型...

ECI Pod Annotation

取值范围:BGP:BGP(多线)线路 BGP_PRO:BGP(多线)精品线路 更多信息,请参见 EIP线路类型。k8s.aliyun.com/eip-internet-charge-type PayByBandwidth EIP的计量方式。取值范围:PayByBandwidth:按带宽计费 PayByTraffic:按流量计费 ...

ECI Pod Annotation

取值范围:BGP:BGP(多线)线路 BGP_PRO:BGP(多线)精品线路 更多信息,请参见 EIP线路类型。k8s.aliyun.com/eip-internet-charge-type PayByBandwidth EIP的计量方式。取值范围:PayByBandwidth:按带宽计费 PayByTraffic:按流量计费 ...

基于ack-lingjun-aiast组件实现集群自动化运维

组件介绍 安装灵骏AI助手开启PAI的作业监控和恢复功能后,当发生故障或异常时,灵骏AI助手的告警系统可以自动和PAI进行交互,并上报故障信息,并根据故障触发阶段和并行策略选择规避故障的方法,自动隔离故障节点,并通过checkpoint快速...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
负载均衡 数字证书管理服务(原SSL证书) 共享流量包 检索分析服务 Elasticsearch版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用