自动快照概述

应用场景 使用自动快照对运行关键应用的云盘进行定期数据备份,应对因删、勒索病毒等造成的数据丢失或者应用系统故障,需要时能快速找回云盘数据以保证业务的连续性。注意事项 使用自动快照策略时,您需要注意以下事项:限制项 说明 自动...

资源使用优化

优化资源利用 资源利用提升本质就是用最少的资源最大化满足算力需求,同时需综合考虑业务布局、容灾和稳定性、机器故障率、预留缓冲空间等因素,这些因素交织在一起共同资源使用效率。概括起来需要被关注到的内容包括:明确资源利用...

附录:SOFAStack 产品目录

集群任务允许用户自己对数据进行拆分,将待处理数据拆分成一个个索引,业务集群中的每台机器都会分配到数据进行处理,使用灵活,并可以监控任务的执行情况。金融行业的日切 金融行业的日切是一个很复杂的操作,需要多个任务按照指定顺序...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细化摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

捷顺

客户价值 DAS服务让DBA可以提前洞察到数据库的运行趋势,及时做好预案,系统故障率降低了60%以上,大幅提高了客户满意度和用户体验。DAS服务自动SQL限流和自动SQL调优,帮助DBA从救火员转向数据库架构师,有更多时间和精力帮助研发优化系统...

什么是Web应用防火墙

支持合理的检测逻辑复杂度,避免过多检测数据导致的报,降低;支持多种形式数据编码的自适应解码,避免利用各种编码形式的绕过。CC恶意攻击防护 控制单一源IP的访问频率,基于重定向跳转验证、人机识别等。针对海量慢速请求攻击,...

什么是Web应用防火墙

支持合理的检测逻辑复杂度,避免过多检测数据导致的报,降低;支持多种形式数据编码的自适应解码,避免利用各种编码形式的绕过。CC恶意攻击防护 控制单一源IP的访问频率,基于重定向跳转验证、人机识别等。针对海量慢速请求攻击,...

常见问题

网站耗资源(客户程序故障常见问题 通过Robots协议屏蔽搜索引擎抓取网站内容 流量统计常见问题 云虚拟主机可以升级到云服务器ECS吗?如何取消云虚拟主机的自动续费功能?产品计费问题 计费常见问题 安装网站程序问题 安装完WordPress程序...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理和实例操作系统内相关配置进行全方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

常见问题

常见原因:内存使用比较高。您可以采取如下解决方案。把OSS上的文件拆分为一个一个的小文件,然后再进行导入。进行内存的升配。如何升配,请参见 社区兼容版集群变配和水平扩缩容。如何处理导入数据报错:too many parts?ClickHouse每次...

常见问题

本章节汇总了使用ARMS告警管理监控的常见问题。本页目录 ARMS Prometheus监控新旧版本告警规则有何不同?指定了新的通知策略,仍然收到了旧的告警通知?为什么配置了告警规则的通知策略,告警还是发给我了?为什么通知策略中出现了标签为_...

最佳实践

存储服务数据容灾最佳实践 冗余存储 阿里云对象存储OSS提供本地冗余存储和同城冗余存储两种存储冗余类型,覆盖从单可用区到多可用区的数据冗余机制,以保证数据的持久性和可用性。...并将删的数据快速恢复,大大提高故障恢复效率。

内容审核常见错误码

400 InvalidParameter.BadRequest 请求有,通常是请求参数不正确导致的,请检查请求参数。400 InvalidParameter.Format 待检测内容格式错误,请确保待检测的内容在API的限制范围内。400 InvalidParameter.NotFound 参数错误,请根据算法...

内存诊断

容器智能运维平台 提供内存诊断功能,可以覆盖Kubernetes集群上常见的内存问题,包括内存泄漏、内存碎片化、OOM等。诊断结果以图表的方式展示系统内存整体使用情况,将容器内的缓存和共享内存归属到具体的文件夹下,清晰展示系统内存使用...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

云市场常见问题

本章节介绍阿里云OCR在云市场官方店铺(“阿里云计算有限公司”)的常见问题。产品功能相关问题 对图片的格式大小有怎样的要求?阿里云文字识别服务要求单张图片大小不超过10M,图片最长边不超过4096像素,最短边不小于15像素,当长边超过...

节点诊断

ECS实例云盘读写IOPS超过上限读写受限,请您降低磁盘的读写频率或升级为更高性能的云盘类型,有关云盘的读写性能指标,请参见 存储性能。ECS实例磁盘加载情况 检查ECS实例在启动时云盘是否能正常挂载。云盘挂载失败,导致实例无法正常...

图片人脸检索

匹配概率越高,对应的越低,具体如下:取值0.50,0.05 取值0.60,0.01 取值0.70,0.005 取值0.80,0.001 取值0.90,0.0001 取值0.92,0.00001 取值0.94,0.000001 取值0.96,0....

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用升高、内存利用升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

DescribeVerifyResult

置信度阈值参考:为0.001%时,对应阈值为95。为0.01%时,对应阈值为90。为0.1%时,对应阈值为80。为1%时,对应阈值为60。说明 该字段只表示人脸与权威数据的比对结果,仅供您参考,通常不建议业务上仅以该值作为...

DescribeVerifyResult

置信度阈值参考:为0.001%时,对应阈值为95。为0.01%时,对应阈值为90。为0.1%时,对应阈值为80。为1%时,对应阈值为60。说明 该字段只表示人脸与权威数据的比对结果,仅供您参考,通常不建议业务上仅以该值作为...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

语音识别FAQ

本文汇总了您在使用语音识别服务时的常见问题。语音识别类常见问题主要分为以下几类:功能类 实时转写说话有停顿,但是语音识别不断句怎么办?语音识别能自动断开多句话吗?语音识别服务支持离线功能吗?语音识别支持哪些模型?语音识别...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个...后续步骤 停止演练 常见问题 故障演练常见问题

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

故障演练

常见故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

EMR Kafka磁盘故障运维

这些情况有可能影响到线上业务平稳运行、数据丢失、Kafka集群容错能力下降,单故障甚至有可能因为IO处理能力下降导致集群出现雪崩效应、引起重大生产事故。因此需要对磁盘故障进行有效监控以便及时发现故障。当磁盘发生故障时,应及时...

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制台常见问题 网站耗资源(客户程序故障常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

故障发现

各业务对故障的重视程度都非常高,发、漏发故障都会产生较大影响,故障需要人工确认发送保证准确;故障处理过程需要人工组织跟进;故障应急争分夺秒,Oncall时效难以保障。7*24监控值班的主要考核指标有:通告及时、通告准确、快恢...

合理利用存储备份保障业务数据可还原

常见的几种场景如下:机器/磁盘故障导致数据丢失 人为操作导致数据丢失 有状态服务如数据库的升级出现问题,需要进行回滚恢复 解决方案 ADP的本地运维控制台提供了面向业务数据的备份还原能力:以组件下工作负载(通常是statefulset)为...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 数据库自治服务 商标服务 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用