故障隔离

时间窗口大小 设置故障检测的时间,与 时间窗口内最少调用次数 配合,只有在指定时间段内进行指定次数的请求才会被采集。取值范围:(1,60]单位:秒 时间窗口内最少调用次数 设置指定时间内的最少调用请求次数。取值≥0。异常比例阈值(%)...

ack-node-repairer

当故障被修复后,NPD会修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,可以将节点的异常,例如Docker Engine Hang、Linux Kernel Hang、网络...

应用场景

通过温度传感器对整个风机的温度测点进行实时监控,并对海量温度数据进行深度学习,构建风机故障检测与感知预测模型,最终做到提前1-2周识别风机微小故障并预警,单台风机单次重大事件维护成本大大降低。生产工艺优化 您可以使用工业大脑...

ReportInstancesStatus-反馈一台或者多台ECS实例异常...

取值范围:hardware-cpu-error:CPU 故障 hardware-motherboard-error:主板故障 hardware-mem-error:内存故障 hardware-power-error:电源故障 hardware-disk-error:磁盘故障 hardware-networkcard-error:网卡故障 hardware-raidcard-...

RDS MySQL内存使用问题

RDS MySQL内存高常见原因 通常InnoDB Buffer Pool的内存占用是最大的,Buffer Pool的内存占用上限受到Buffer Pool配置参数的限制,但是还有很多内存是在请求执行中动态分配和调整的,例如内存临时表消耗的内存、prefetch cache、table ...

组复制简介

该层除了负责消息的传递,还负责故障检测和集群成员的管理。XCom层(Paxos Layer):基于Paxos协议实现,与组通讯层共同实现组复制层与集群的通讯,以及消息传递的全局有序性和集群成员的角色切换。它能够保证所有节点收到数据的顺序一致,...

java_lang_OutOfMemoryError

建议使用深度性能测试检测内存泄漏等问题。代码示例/在循环外初始化大对象list并在循环内重复使用,并清空集合类、置null List list=new ArrayList();for(Object tmp:otherList){/to do something } list.clear();list=null;参考文献 ...

TairRoaring性能白皮书

parallel batching bps(bit per second)平均时延(ms)20 10 572700 0.34 10 50 725900 0.65 7 100 772000 0.85 7 200 788800 1.67 5 500 746000 3.1 2 100 770000 2.1 单Key内存测试 通过TR.STAT命令分析不同容量场景下RoaringBitmap的...

设备显示离线

可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的运营商网络正常。如果不正常,请处理运营商网络问题。如果正常,请跳转至 步骤2。请检查设备本身是否上电。电源状态...

重启设备

网络故障时,重启设备可消除部分软件故障。背景信息 重启设备一般有两种方法:通过关闭或打开设备电源进行重启。通过智能接入网关控制台,远程重启设备。关闭或打开设备电源 警告 您通过关闭或打开设备电源进行重启时,请注意保存设备的...

高可用能力

自动高可用模式下,PolarDB PostgreSQL版(兼容Oracle)通过对数据库内核、容器、主机等多维度状态检测,减少故障检测时间,降低故障误判概率,单点故障场景下RTO。手动高可用模式下,PolarDB PostgreSQL版(兼容Oracle)检测机制、状态...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障的发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

概述

系统容错的目标是使系统能够在面对硬件故障软件错误、通信故障或其他异常情况时,能够继续执行,并且不会导致整个系统崩溃或数据损坏。分布式系统常按云端部署架构划分为IaaS、PaaS、SaaS,每层又都依赖计算、存储、网络资源进行构建,在...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

故障注入

您可以通过故障注入功能向测试应用注入故障检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 ...

故障注入

您可以通过故障注入功能向测试应用注入故障检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控...

基于ack-lingjun-aiast组件实现集群自动化运维

该系统能够实时监测并分析系统的运行状态,快速检测故障并采取恢复措施,例如硬件故障、网络故障软件错误等,从而降低运维成本,提高系统可靠性和稳定性。组件介绍 安装灵骏AI助手开启PAI的作业监控和恢复功能后,当发生故障或异常时,...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

以太网接口无法接通

如果测试检测出线缆故障,请更换线缆。设备间双绞线长度是否满足要求。设备间线缆长度需小于100米。说明 10/100/1000 Mbps电接口采用RJ45连接器,接口线缆为5类或5类以上双绞线,此类双绞线最大传输距离为100米。如果线缆长度大于100米...

服务管控和治理

故障注入 您可以通过故障注入功能向测试应用注入故障检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。更多信息,请参见 故障注入。服务鉴权 服务提供者提供服务后,您可以通过...

以太网接口频繁Up/Down

检查项 检查标准 后续操作 用测试测试双绞线是否故障测试仪显示双绞线正常。如果检查出线缆故障,请更换线缆。设备间双绞线长度是否满足要求。设备间线缆长度。说明 10/100/1000M电接口采用RJ45连接器,接口线缆为5类或5类以上双绞线,...

【Fault Injection】故障注入

故意破坏服务,以暴露弱点的测试方法可以提高容错能力,发现客户端的错误,或者识别现有的故障情况。您可以使用虚拟服务在应用层进行故障注入测试。本文介绍如何配置故障注入。前提条件 已完成准备工作,并部署httpbin服务和sleep服务。...

【Fault Injection】故障注入

故意破坏服务,以暴露弱点的测试方法可以提高容错能力,发现客户端的错误,或者识别现有的故障情况。您可以使用虚拟服务在应用层进行故障注入测试。本文介绍如何配置故障注入。前提条件 已完成准备工作,并部署httpbin服务和sleep服务。...

MSE注册配置中心和自建注册配置中心对比

高可用 多可用区部署,故障自动检测及恢复,SLA保障率高达99.95%。需自行探索和开发高可用保障体系,对团队技术要求高。性能 深度优化,TPS性能提升40%、QPS性能提升55%。需自行调优。监控告警 可对集群状态、服务数、配置数、TPS、请求...

容灾预案

2.容灾预案名称 指用户可以为创建的容灾预案输入一个易识别的名称,例如“故障演练测试”3.容灾预案备注 您可以根据创建的容灾预案填写备注信息方便记忆,例如“移动切换联通测试”4.故障地址池 使用容灾预案,您需要配置一个故障地址池。...

主从实例读写分离部署(共享存储)

当出现1分钟容器响应超时(可能是内存溢出、硬件故障软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...

Fast Query Cache

4核8GB 独享型实例 测试工具:Sysbench 数据量:250MB(25张表,每张表40000条记录)场景1:全部命中(只读)测试场景为Sysbench oltp_point_select,用例中仅包括主键上的点查(point select),将Query Cache设为512MB,内存大于测试数据...

应用场景

Node.js 提供的精确到虚拟机级别的深度监控,能够如实的反应应用运行状态,通过配置报警规则,用户可以在发现系统出现故障内存泄露或者 CPU 热点等)趋势时,通过诊断接口迅速定位故障点。Node.js 性能平台特别适合业务发展迅速、应用...

使用HPL测试集群浮点性能

本文介绍如何使用HPL测试E-HPC集群的浮点性能。背景信息 HPL(The High-Performance Linpack Benchmark)是测试高性能计算集群系统浮点性能的基准。HPL通过对高性能计算集群采用高斯消元法求解一元N次稠密线性代数方程组的测试,评价高性能...

增量同步性能白皮书

通过本文您可以了解Tunnel增量性能测试测试环境、测试工具、测试方案、测试指标、测试结果概述以及测试细则等。测试环境 表格存储实例 实例类型:高性能实例 实例地域:华东1(杭州)实例地址:私网地址,避免网络的不确定性因素对测试...

Linux服务器内存消耗过高

ps-eo pid,rss,pmem,pcpu,vsz,args-sort=rss 如上述步骤中,均未查找出异常进程,则继续执行以下操作,检测slab内存分配器占用情况,执行如下命令。cat/proc/meminfo|awk '{sum=$2/1024} {print$1 sum"MB"}' 注:以上命令执行过程中将默认...

ListExperimentMetas

ExperimentId String 1234567890123456789 故障演练ID Tags Array of String 标签 故障演练标签 Name String 测试演练 故障演练名称 Total Integer 123 演练总数 Code String 无 接口错误编码 Success Boolean true 接口请求成功标识 示例 ...

Linux系统的ECS实例的系统、内存或进程出现异常,查看...

问题现象 Linux系统的ECS实例的系统、内存或进程出现异常,通过查看系统日志提示"page allocation failure"错误,表示系统因内存不足导致无法为新的内存页分配内存空间,内存页分配失败。什么是内存内存页(Memory Page)是操作系统中对...

GetExperimentTask

调用GetExperimentTask接口查询故障演练任务详情。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String...

MYSQL深潜-剖析Performance Schema内存管理

本文通过阅读PFS引擎的内存管理源码,解读PFS内存分配及释放原理,深入剖析其中存在的问题以及改进思路。概述 MySQL Performance Schema(PFS)是MySQL提供的强大的性能监控诊断工具,提供了一种能够在运行时检查server内部执行情况的特...

TairVector性能白皮书

实例规格 由于测试结果受规格影响较小,本次测试以16 GB(tair.rdb.16g)规格为例,规格详情请参见 内存型实例规格。客户端测试环境 与 Tair 实例为同专有网络(VPC)的ECS实例,且与 Tair 通过专有网络连接。Linux操作系统。已安装Python ...

内存型(兼容Redis 5.0)性能白皮书

本文介绍 云原生内存数据库Tair 内存型(兼容Redis 5.0)性能测试测试环境、测试工具、测试方法与测试结果。产品概述 Tair 内存型适合并发量大、读写热点多、对性能要求极高的场景。相比云数据库Redis社区版,内存型主要在下述方面进行了...

持久内存型性能白皮书

本文介绍 云原生内存数据库Tair 持久内存型性能测试测试环境、测试工具、测试方法与测试结果。产品概述 Tair 持久内存型,基于持久内存技术,为您提供大容量、兼容Redis的内存数据库产品。单实例成本对比云数据库Redis社区版最高可降低30...

Tair(Redis企业版)简介

阿里云数据库Redis企业版(又称阿里云Tair),是基于阿里集团内部使用的Tair产品研发的云上托管企业级内存数据库,从2009年开始正式承载阿里集团业务,历经天猫双十一、...相关文档 内存型性能测试 持久内存型性能测试 云盘(ESSD)型性能测试
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Memcache 版 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用