ReportInstancesStatus-反馈一台或者多台ECS实例异常...

取值范围:hardware-cpu-error:CPU 故障 hardware-motherboard-error:主板故障 hardware-mem-error:内存故障 hardware-power-error:电源故障 hardware-disk-error:磁盘故障 hardware-networkcard-error:网卡故障 hardware-raidcard-...

应用场景

Node.js 提供的精确到虚拟机级别的深度监控,能够如实的反应应用运行状态,通过配置报警规则,用户可以在发现系统出现故障内存泄露或者 CPU 热点等)趋势时,通过诊断接口迅速定位故障点。Node.js 性能平台特别适合业务发展迅速、应用...

时延洞察

您可以通过该功能排查 Tair 数据库的故障和性能降低的原因。功能简介 原生Redis在2.8.13版引入时延监控(Latency Monitoring)特性,基于事件机制帮助您发现和排查可能的时延问题。该功能仅支持获取最近160秒的数据,且只存取每秒内时延...

实时分析链路数据

而磁盘打满、内存溢出等故障仅影响单个容器。因此,在排查单机故障时,可以根据宿主机IP和容器IP两个维度分别进行分析。面对这类问题,可以通过调用链分析先筛选出异常或超时请求,然后再根据宿主机IP或容器IP进行聚合分析,可以快速判断...

服务实例隔离与诊断

服务实例隔离与诊断可以有效地应对线上故障(例如内存泄露),提升微服务系统整体稳定性。当服务提供者的某些实例出现异常时,MSE治理中心将异常实例的流量隔离,并结合阿里云 应用实时监控服务 ARMS(Application Real-Time Monitoring ...

组复制简介

例如,5个节点的集群,3个节点收到Binlog,2个节点未收到Binlog,此时有2个节点故障:如果故障的2个节点是收到Binlog的节点,那至少还有1个节点上有数据。如果故障的2个节点是没收到Binlog的节点,那至少还有3个节点上有数据。说明 多数派...

诊断项与诊断结果说明

如果该实例当前内存的总使用率已经超过80%,会列出内存使用率排名前5的进程,请检查对应进程是否正常。分析Windows内存使用率过高的具体操作,请参见 Windows系统内存分析工具介绍。Windows常用业务端口占用状态检查 检查Windows系统的3389...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

主从实例读写分离部署(共享存储)

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...

PolarDB Serverless实现了哪些突破

然而,CPU和内存资源比例的绑定在某些场景下对用户是不合理的:分析型内存数据库:用户使用少数CPU来定期同步和更新数据。但为了避免从磁盘来读取数据的时间延迟。维表数据、或者中间结果需要缓存在内存里,需要较大内存。事务型数据库:...

手动执行主备切换

除了自动故障转移,云原生内存数据库Tair 支持手动执行主备切换(即切换节点角色),方便您进行实时容灾演练,验证客户端程序的差错处理能力。如果实例部署在多可用区,您还可以根据业务的部署情况执行主备切换,满足应用就近连接的需求。...

跨可用区容灾

否则需要手动输入 CPU 和 内存 数据,用于指定故障恢复后ECS实例的规格。恢复网络 从下拉列表中选择恢复网络。故障恢复时,HDR使用该网络恢复容灾数据。HDR默认读取从站VPC网络的可用虚拟交换机。复制网络和恢复网络不在一个可用区时,将...

跨地域容灾

否则需要手动输入 CPU 和 内存 数据,用于指定故障恢复后ECS实例的规格。恢复网络 从下拉列表中选择恢复网络。故障恢复时,HDR使用该网络恢复容灾数据。HDR默认读取从站VPC网络的可用虚拟交换机。复制网络和恢复网络不在一个可用区时,将...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障...在 故障恢复 面板,填写 CPU、内存 信息、选择 恢复网络、IP地址、编辑 恢复后执行脚本。故障恢复完成后,在 操作 列表,选择 更多>故障切换>注册,再次注册被保护服务器。

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸...在 故障恢复 面板,填写 CPU、内存 信息、选择 恢复网络、IP地址、编辑 恢复后执行脚本。故障恢复完成后,在 操作 列表,选择 更多>故障切换>注册,再次注册被保护服务器。

集群监控告警说明

内存已经过度使用无法容忍节点故障,节点资源使用的总量超过节点的内存总量,所以如果有节点故障将影响集群资源运行因为所需资源将无法被分配 KubeCPUQuotaOvercommit 集群CPU是否超分。查看 CPU 资源分配的额度是否超过集群群总额度 ...

开源ChaosBlade与商业化AHAS CHAOS故障演练对比

项目 AHAS CHAOS故障演练 ChaosBlade CPU演练 支持 支持 内存演练 支持 支持 网络演练 支持 支持 应用进程演练 支持 支持 K8s演练 支持 支持 阿里云云服务演练(ECS、Redis)支持 不支持 场景化——微服务强弱依赖演练 支持 不支持 场景化...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

如何将一棵LSM-Tree塞进NVM

Engine为基础结合非易失内存的优势与限制,重新设计并实现了存储引擎的主要内存数据结构、事务处理和持久化内存分配器等基础组件,最终实现了不需要记录预写式日志的高性能事务处理,降低了整体系统的写入放大并提高了存储引擎的故障恢复...

回切至本地物理机

故障切换 面板,填写 CPU、内存 信息、选择 恢复网络、IP地址、是否 使用SSD、选择 恢复点、弹性公网IP、切换后执行脚本。注意 当前时间 恢复点只能使用一次。在弹出的 完成故障切换 对话框,单击 确定。本地恢复 注意 目前仅支持本地...

AliPG内核小版本发布记录

增强 ST_Union 函数,支持按内存使用量分批次执行,避免大数据量造成OOM。栅格数据支持对HDFS文件系统支持。新增 pg_jieba 中文分词插件,支持自定义词典和词典切换,支持按照每个字段的偏移量显示分词结果。缺陷修复 修复当推荐索引都已...

故障演练

进程外的故障,比如其他进程突然抢占了内存,导致当前系统异常等。对于大多数无损突袭演练的故障模拟,只需要关注故障对当前系统的影响,而不是真的需要外部产生故障。此外,还有一类故障,可能是人为失误,或流程不当导致,这部分不做重点...

功能优势

丰富的故障场景 丰富的故障场景也是 AHAS Chaos 的一大特色,包括了以下场景:常见的基础设施资源例如CPU、内存、磁盘等。应用级别的故障注入,目前只支持 Java 应用,后续将陆续推出对于 NodeJs 和 C++ 的应用故障注入。云原生领域的演练...

网站耗资源(客户程序故障)常见问题

网站耗资源(客户程序故障)主要分为过度消耗CPU资源和过度消耗内存资源两种情况。网站耗资源(客户程序故障)与大流量的区别是什么?大流量会导致网络带宽被严重占用,而网站耗资源(客户程序故障)则导致服务器无法正常运行。两者的具体...

云数据库Redis版产品选型必读

说明 集群架构可选择不同的连接模式:代理模式:客户端的请求由代理节点转发至数据分片,可享受代理节点带来的负载均衡、读写分离、故障转移、代理查询缓存(仅内存型支持)、长连接等特性能力。更多信息,请参见 Redis Proxy特性说明。直...

Tair客户端重连指南

引发暂时性故障的原因 原因 说明 故障触发了高可用机制 云原生内存数据库Tair 支持节点健康状态监测,当监测到实例中的主节点不可用时,会自动触发主备切换,例如将主节点和从节点进行互换,保障实例的高可用性。此时,客户端可能会遇到...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

配置使用持久内存

重要 持久内存中数据的可靠性取决于物理服务器和持久内存设备的可靠性,因此存在单点故障风险。建议您在应用层做好数据冗余,将需要长期保存的业务数据存储到云盘上,以保证应用数据的可靠性。将持久内存配置为一块本地盘 本文示例中使用的...

内存

推荐 内存型实例规格族r8a 内存型实例规格族r8i 内存平衡增强型实例规格族r8ae 内存型实例规格族r8y 内存增强型实例规格族re7p 内存型实例规格族r7p 存储增强内存型实例规格族r7se 内存型实例规格族r7a 内存型实例规格族r7 安全增强内存型...

实例规格族

根据CPU、内存等配置,一种实例规格族又分为多种实例规格。ECS实例规格 定义了实例的基本属性:CPU和内存(包括CPU型号、主频等)。但是,ECS实例只有同时配合块存储、镜像和网络类型,才能唯一确定一台实例的具体服务形态。说明 各个地域...

系统类故障排查

概述 本文主要介绍使用阿里云服务器ECS时的系统类故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

网关一体机告警介绍

本文介绍网关一体机中磁盘故障、电源故障等硬件告警,以及CPU使用率、内存使用率等软件告警信息。监控项 报警阈值 报警通道 恢复是否通知 疲劳度 是否实时 CPU使用率 一分钟内平均使用率超过95%客户邮箱 是 每日最多5封 是 内存使用率 一...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

常见问题

Node.js 性能平台运行时是否会影响性能 Node.js 性能平台运行时每分钟在主线程将监控数据写到内存中,通过额外的日志线程写日志到文件,因此对性能影响可以忽略。做故障诊断时,执行诊断功能 3 分钟,随后自动切回到正常运行状态。Node.js ...

使用可视化演练

运行环境 可选择 机器负载高、内存消耗高、磁盘无剩余空间 或 磁盘读写过高 场景。服务依赖 可选择 本地服务丢失、本地服务延迟、调用下游服务丢失 或 调用下游服务延迟 场景。设置自动恢复时间。单击 执行演练。当演练进行时,您可在图示...

持久内存

云原生内存数据库Tair 持久内存型(简称持久内存型),基于持久内存技术,为您提供大容量、兼容Redis的内存数据库产品。单实例成本对比云数据库Redis社区版最高可降低30%,且数据持久化不依赖传统磁盘,保证每个操作持久化的同时提供近乎...

规格查询导航

云原生内存数据库Tair 具备多种类型、系列和架构,您可以通过本文的导航信息快速找到相关类型实例的规格文档。实例规格文档 简介 内存型实例规格 采用多线程模型,性能约为同规格社区版实例的3倍。标准架构:内存容量上限可达64 GB,支持约...

排查内存使用率高的问题

云原生内存数据库Tair 可提供高效的数据库服务,当内存不足时,可能导致Key频繁被逐出、响应时间上升、QPS(每秒访问次数)不稳定等问题,进而影响业务运行。通常情况下,当内存使用率超过95%时需要及时关注。Tair内存占用介绍 Redis的内存...

混合存储型(已停售)

云原生内存数据库Tair 混合存储型整合了内存和磁盘二者的优势,在提供高速数据读写能力的同时满足了数据持久化的需求。说明 混合存储型已停止售卖,更多信息,请参见【通知】混合存储型实例停止售卖,推荐选择 持久内存型 实例。简介 图 1....

常见问题

本文列举出 云原生内存数据库Tair 实例有关产品特性的常见问题供您参考。Tair实例兼容Redis哪个版本?云原生内存数据库Tair 兼容多个原生Redis版本,可为您提供丰富的选择。Tair 内存型(兼容Redis 6.0):完全兼容Redis社区6.2版本及以下...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 Memcache 版 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用