Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

如何使用Prometheus监控SNMP

首先,SNMP帮助运维人员收集网络上不同设备带宽使用量的信息,在进行故障排除的同时,更加快速找出网络性能趋势或问题。SNMP采集到的数据都是来自设备提供,不同厂商的设备可以提供的数据不尽一致,SNMP Exporter尽可能多的提供兼容,默认...

计费说明(容器服务实例)

3个月 自定义规格总费用=超大规格费用+自定义费用=超大规格费用+(设置的自定义指标上报量-600)/100*1,500 说明 在超大规格自定义指标额度(600亿次)基础上,设置的自定义指标上报量每增加100亿次,自定义规格费用在对应超大规格费用基础...

计费说明(容器服务实例)

3个月 自定义规格总费用=超大规格费用+自定义费用=超大规格费用+(设置的自定义指标上报量-600)/100*1,500 说明 在超大规格自定义指标额度(600亿次)基础上,设置的自定义指标上报量每增加100亿次,自定义规格费用在对应超大规格费用基础...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

测试指标

系统性能指标 交易响应时间 定义及解释 响应时间指用户从客户端发起一个请求开始,到客户端接收到从服务器端返回的响应结束,整个过程所耗费的时间。在性能检测中一般以压力发起端至被压测服务器返回处理结果的时间为计量,单位一般为秒或...

RDS与自建数据库对比优势

备节点的故障发现时长为秒级,在99%的场景下,备节点从故障发生到节点恢复不超过10分钟。在好的架构下才能实现高可靠性。实现RPO=0的成本极高,需要单独购买研发服务。数据可靠性一般,取决于单块磁盘的损害概率。实现RPO=0的成本极高,...

监控、诊断和故障排除

因此诊断性能问题首先需要设置合理的基准线,然后通过监控服务提供的性能指标确定性能问题可能的根源位置,然后根据日志查到详细的信息以便进一步诊断并且排除故障。诊断错误 客户端应用程序会在请求发生错误时接收到服务端返回的相关错误...

功能特性

创建实例 自动切换 在实例主节点发生故障时将自动切换,实现实例的故障自愈,切换通常需要30秒左右完成。主备切换 全量备份与全量恢复 对当前实例通过内存快照方式对全量数据进行备份并保存在云存储中,可通过全量恢复将数据恢复至备份时。...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。容灾演练操作步骤如下:登录 混合云容灾管理控制台。单击 切换到连续复制型容灾。在 概览 页面,单击目标容灾站点对。在容灾中心页面,单击 受...

如何使用Prometheus监控Windows

指标名称 指标级别 指标来源 指标说明 可用物理内存(MB)Critical WMI(AvailableMBytes)多个进程之间对RAM的争用将不可避免地导致分页,进而导致性能下降。为了保证机器继续运转,需要确保机器有足够的RAM来处理日常的工作负载。持续的...

附录:SOFAStack 产品目录

分析服务性能:调用拓扑中的应用都可以单独进行下钻分析,可以从吞吐、错误率、响应时间等指标对应用性能进行详细分析。应用性能和架构的优化 在调用关系拓扑中能对各个应用的调用次数和耗时情况进行查看和分析,找到负载较高和负载较少的...

如何使用Prometheus监控Windows

指标名称 指标级别 指标来源 指标说明 可用物理内存(MB)Critical WMI(AvailableMBytes)多个进程之间对RAM的争用将不可避免地导致分页,进而导致性能下降。为了保证机器继续运转,需要确保机器有足够的RAM来处理日常的工作负载。持续的...

网络资源

网络资源是指用于节点之间通信和数据传输的硬件和软件资源,除了包括广域、局域交换机、路由器,还包括常用到的专有网络、虚拟交换机、负载均衡、弹性公网、VPN、DNS、CDN等资源。在分布式系统中,网络资源的主要作用是支持节点之间...

弹性网卡概述

您可以通过在一张弹性网卡(包括主网卡和辅助弹性网卡)上分配一个或多个辅助私IP地址,实现专有网络VPC类型ECS实例的高利用率和负载故障时的流量转移。更多信息,请参见 分配辅助私IP地址。单台ECS实例vCPU处理网络中断存在性能瓶颈时...

什么是公网NAT网关

说明 从2022年09月19日起,新创建的公网NAT网关绑定一个EIP时将占用NAT网关所在交换机的一个私IP(已有NAT网关实例不受影响),请确保NAT网关所在交换机内私IP地址充足,如果NAT网关所在的交换机没有可用的空闲私地址时,将无法绑定...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

概览

智能阈值报警是针对云监控中的云资源实例的监控指标推出的智能报警功能,它自动适配并拟合监控指标的历史数据,展示报警阈值边界,发现监控指标突增或突降的异常行为,为您业务的稳定性提供保障。什么是智能阈值 智能阈值基于机器学习算法...

App端性能体验功能说明

性能监控产品通过轻量级的集成接入即可拥有实时、可靠、全面的应用崩溃、ANR、自定义异常等捕获能力,及卡顿、启动分析等性能能力,支持多场景、多通道智能告警监控,帮助开发者高效还原异常、卡顿用户的访问路径和业务现场,缩短故障排查...

云网络互访性能观测

阿联酋(迪拜)云网络互访性能指标 地域内网络性能:查看同一地域内 ECS 实例之间访问的网络时延情况。同一地域内,各可用区 ECS 实例间访问的平均时延。由于个别可用区阿里云探测集群覆盖不到,可能会出现可用区无数据的情况,请以实际...

产品优势

安全可靠 DTS底层为服务集群,如果集群内任何一个节点宕机或发生故障,控制中心都能够将这个节点上的所有任务快速切换到其他节点上,链路稳定性高。DTS内部对部分传输链路提供7×24小时的数据准确性校验,快速发现并纠正传输数据,保障传输...

评估合适的云服务

存储指标 在业务场景、功能和架构的基础上,还需要将业务系统数据转化为存储性能指标以便进一步评估存储产品和类型选择,主要的存储指标包括吞吐量、IOPS、I/O延迟、访问频率、数据规模、数据增长率、数据可靠性等,必要的基准测试以及持续...

实时性能

云数据库MongoDB支持查看实例的读写延迟、QPS、操作统计、连接统计、网络流量等性能指标的实时数据,帮助您实时了解数据库性能情况。前提条件 实例为单节点实例、副本集实例或协议类型为MongoDB的分片集群实例。操作步骤 登录 MongoDB管理...

性能监控概念

性能监控是指在软件、硬件或系统运行期间对其性能指标进行监测和记录,以便分析和优化系统性能。通过收集和分析性能数据,可以识别系统瓶颈、优化资源分配、提高系统可靠性和稳定性等。性能监控通常包括对系统资源的监控,如CPU、内存、...

功能特性

监控专有宿主机 网络性能指标 可以查看DDH上所有ECS实例的出、入方向网络每秒收包数之和及其出、入方向网络每秒带宽之和。监控专有宿主机 运维 故障迁移 如果一台DDH有潜在故障风险,其物理机处于可用状态,但随时可能出现故障,导致DDH中...

报警设置

当 云原生内存数据库Tair 性能指标(CPU、内存使用率等)异常或实例触发高可用切换时,云监控平台会向您发送警告信息。背景信息 云监控(CloudMonitor)是针对阿里云资源和互联网应用提供监控的服务,为您提供开箱即用的企业级开放型一站式...

报警设置

当 云数据库 Redis 版 性能指标(CPU、内存使用率等)异常或实例触发高可用切换时,云监控平台会向您发送警告信息。背景信息 云监控(CloudMonitor)是针对阿里云资源和互联网应用提供监控的服务,为您提供开箱即用的企业级开放型一站式...

查看事件与监控信息

故障列表 故障列表显示当前应用分组正在报警的全部资源,如果正在报警的规则被禁用,则故障列表中不再显示被禁用规则的故障信息。可用性监控 查看服务实例可用性的监控信息。组进程监控 查看组进行监控的进程ID、动态规则匹配和状态等信息...

设置常用的MongoDB监控报警规则

通过对实例的关键性能指标设置监控报警规则,让您在第一时间得知指标数据发生异常,帮助您迅速定位并处理故障。操作步骤 登录 MongoDB管理控制台。在页面左上角,选择实例所在的资源组和地域。根据实例类型,在左侧导航栏,单击 副本集实例...

创建数仓版集群

弹性IO资源 您可以根据弹性IO资源的存储性能指标预估需要的弹性IO资源个数,详情请参见 基于EIU的存储性能指标。如果您无法预估集群所需的存储空间,可以先仅购买1组弹性IO资源,后续在使用过程中通过扩容再购买弹性IO资源。详情请参见 数...

设计方案

当指标较多时,优先关注高优先级的业务指标,业务指标能够最直观反映当前系统状况,当业务指标发生变化时,往往应用指标也会有相应的变化。变更前需准备好对应的检查清单。在变更期间,要做到持续观察监控数据,确定是否有负面影响或问题。...

流量回放和压测

性能趋势对比 压测任务前后,在不同性能指标上源实例与目标实例的差异对比。SQL对比 若目标实例在压测前已 开启自治功能,可分析压测前后,源实例与目标实例上SQL模板的执行性能差异对比。说明 SQL对比 可用来应对数据库引擎升级、规格切换...

智能压测

性能趋势对比 压测任务前后,在不同性能指标上源实例与目标实例的差异对比。SQL对比 若目标实例在压测前已 开启自治功能,可分析压测前后,源实例与目标实例上SQL模板的执行性能差异对比。说明 SQL对比 可用来应对数据库引擎升级、规格切换...

Tair选型指南

创建 云原生内存数据库Tair 实例前,您需要结合产品性能、价格、业务场景、工作负载等因素,做出性价比与稳定性最优的决策。本文围绕以上因素,着重介绍实例类型、引擎版本、架构、存储介质,为您的选型提供相关参考。免费试用 阿里云免费...

地域和可用区

如果其中一个可用区的实例发生故障,可以让另一个可用区的实例来处理相关请求。如果您的应用要求实例之间的网络延时较低,建议您将实例创建在同一可用区内。将ECS实例迁移到其他可用区 您可以将实例从一个可用区迁移到另一个可用区。主要...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

云数据库Redis版产品选型必读

创建Redis实例前,您需要结合产品性能、价格、业务场景、工作负载等因素,做出性价比与稳定性最优的决策。本文围绕以上因素,着重介绍实例类型、引擎版本、架构、存储介质,为您的选型提供相关参考。免费试用 阿里云免费试用面向符合条件的...

可观测概述

可观测性在云原生应用中扮演着非常重要的角色,它可以帮助我们实时监控服务的运行情况和性能指标,发现并解决服务故障和瓶颈,从而提高应用的可靠性和性能。阿里云服务网格ASM提供了统一标准化方式,为您提供一种收敛后的可观测数据生成与...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云企业网 共享流量包 弹性公网IP 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用