监控、诊断和故障排除

故障排除 性能相关常见问题 平均E2E延时高,而平均服务端延时低 前面介绍了平均E2E延时与平均服务器延时的区别。所以产生高E2E延时、低服务器延时可能的原因有两个:客户端应用程序响应慢 可用连接数或可用线程数有限 对于可用连接数问题,...

一键诊断

会话管理 性能趋势 锁分析 慢SQL 空间分析 常见问题 Q:一键诊断中,如何计算会话的线程使用率、连接数使用率和最大线程数?A:RDS MySQL的计算公式如下:线程使用率=活跃线程数/最大线程数 连接数使用率=当前连接数/实例规格最大连接数 ...

常见问题

重要 如遇各类问题,请联系 NAS技术支持 进行咨询。产品简介FAQ 什么是文件存储NAS?文件存储NAS支持哪些访问协议?如何选择NFS和SMB文件系统协议?...更多产品简介常见问题 产品定价FAQ 开通NAS服务后,就开始计费吗?...更多高级管理常见问题

故障应急

故障管理体系是围绕故障全生命周期采取的一系列控制流程,包括故障基础数据管理故障等级定义、应急场景监控覆盖、服务组&值班表管理故障订阅管理),故障发现(7*24监控值班、智能基线告警),故障应急协同(故障通告及更新、故障应急...

常见问题

集群管理常见问题 CDP使用常见问题

组件中心

中间件 分布式链路跟踪 一款实时监控并管理企业应用性能和故障的云服务,其提供数字化性能管理解决方案,帮助企业在分布式架构下快速发现并准确定位应用全生命周期的性能问题。任务调度 提供分布式任务调度框架,实现任务的分布式处理,并...

性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

常见问题

密钥管理常见问题 KMS是否支持删除密钥 用户主密钥(CMK)删除后,使用该密钥加密的用户数据及产生的数据密钥是否还可以解密 KMS如何保障密钥的安全性 KMS是否支持导入密钥材料 密钥状态为不可用或调用密钥相关API时返回“Rejected....

查看作业结果

在左侧导航栏,选择 作业与性能管理>作业。单击目标作业列表右侧 详情,可以查看作业详细信息。查看作业性能指标。在左侧导航栏,选择 作业 与性能 管理>E-HPC优化器。找到gromacs-test集群,在操作列,单击 节点。选择作业和节点并完成...

常见问题

本文档汇总了ARMS各子产品的常见问题。应用监控:常见问题概述 前端监控:前端监控常见问题 可观测...可观测链路 OpenTelemetry 版:可观测链路 OpenTelemetry 版常见问题 可观测链路 OpenTelemetry 版常见问题 告警管理:告警管理常见问题

常见问题

本文为您整合了使用MaxCompute过程中的常见问题。问题分类 常见问题 产品计费 计费常见问题 规格类型 ...安全管理 权限管理常见问题 安全配置常见问题 运维管理 Information Schema常见问题 其他运维常见问题 小文件优化及作业诊断常见问题

管理作业模板

在左侧导航栏,选择 作业 与性能 管理>作业。在 作业 页面,选择待创建作业模板的集群。单击页面左侧的 提交作业 页签。在 提交作业 区域,完成作业参数配置,单击 图标将当前作业参数配置保存为模板。作业模板名不能和已创建的作业模板名...

停止作业

当作业运行失败或不再需要...在左侧导航栏,选择 作业与性能管理>作业。在 作业 页面,在 集群 列表中选择作业所在集群。单击 作业列表 页签,在作业状态栏选择 未完成。单击要停止的作业操作列的 详情。单击作业信息面板右下角的 停止作业。

概述

本章节会全面描述基于云基础设施的高性能系统设计、实施和优化等环节,包括如下主要内容:高性能架构设计:包括高性能架构常见设计准则、业务适应规格和类型、可伸缩和可扩展、性能层面部分架构设计最佳实践和挑战和注意事项等内容。性能...

服务支持

数据源管理常见问题 自定义域名常见问题 DataV-TwinFabric 孪生仿真 配置了RAM账号后,为什么搜不到 DataV-Atlas 可视分析地图 数据源问题 DataV-Card可视分析创作间 数据集常见问题 数据集数据源问题 分区值格式说明 如何在钉钉中配置长图...

故障基础数据管理

故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障。对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...

监控作业

在左侧导航栏,选择 作业与性能管理>作业。在 作业 页面,选择目标集群,单击 作业监控 页签。设置筛选条件。支持设置的筛选条件如下:时间段:过滤某一时间段内的作业数据。可快速选择查看距离当前时间前1小时、4小时、12小时或1天的数据...

自动伸缩最佳实践

在左侧导航栏,选择 作业与性能管理>作业。在 集群 列表中,选择AutoScaling集群,单击 创建作业。在 创建作业 页面,选择 编辑作业文件>新建文件>使用文件模板>pbs demo。在编辑作业文件页面,配置lj.in文件和AutoScaling.pbs,单击 确认 ...

查看集群报表

在左侧导航栏,选择 作业与性能管理>报表。在顶部下拉列表中,选择目标集群。查看报表。查看集群节点数量。节点数量展示集群中节点数量的变化折线图,支持显示各队列节点数量变化。查看某一时间段的集群资源使用量。资源使用量包含用户使用...

查看集群性能

在左侧导航栏,选择 作业 与性能 管理>E-HPC优化器。在 性能大盘 页面,找到目标集群,查看集群的基本信息和节点热力图。如上图所示,热力图中每个方格表示一个节点,鼠标移动到对应的节点即可显示该节点的名称和对应的性能。说明 节点热力...

使用限制常见问题

通过本文您可以了解智能媒体管理常见的使用限制相关问题。智能媒体管理有并发能力限制吗,如何调整?智能媒体管理有并发能力限制,您可以在 限额配置 中查看具体限制。当您的请求超过限制时,您的请求会被拒绝。当您在业务中遇到并发能力...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

测试SCC集群性能

rdma_monitor-s 返回示例如下:查看SCC集群节点的性能 在 弹性高性能计算控制台 的左侧导航栏,选择 作业 与性能 管理>E-HPC优化器。在 性能大盘 页面,选择目标集群,在操作列单击 节点。在 节点性能 页签,选择对应的节点、时间段和指标...

人脸聚类相关问题

关于新版智能媒体管理人脸聚类的常见问题,请参见 图片管理常见问题。为什么无法生成人脸分组?为了确保人脸分组的准确性,生成分组需要满足如下条件:使用IndexImage将图片添加到媒体集。同一个人物在媒体集中的图片必须大于或等于3张,...

常见问题

访问OSS资源后资源被强制下载 上传回调中的常见错误及分析处理 OSS上传的视频如何实现在线播放 更多问题 传输管理常见问题 为什么使用传输加速域名进行数据传输时出现502或504状态码?OSS上传或下载文件时速度很慢,怎么办?如何在OSS SDK...

通过控制台提交作业

在左侧导航栏,选择 作业性能与性能管理>作业。在 作业 页面,选择待提交作业的集群。单击 提交作业 页签。在 提交作业 区域,完成作业参数配置。配置项 描述 作业提交模板 您也可以选择已配置的作业模板快速提交作业。更多信息,请参见 ...

产品正式商业化发布

体系化故障闭环管理:基于阿里多年base ITIL实践经验沉淀的故障管理体系,满足企业重大故障的流程化、在线化管理需求,持续提升业务连续性。云钉运维协同:基于钉钉,进行运维问题的协同处理,提升信息流转效率,加速问题解决。更多能力...

故障协同处理(基于钉钉)

云钉运维故障协同效果 功能概述 移动应用端(目前仅支持“钉钉”,以下功能说明均基于钉钉场景)支持接收故障消息提示和进行故障操作,且支持移动端操作管理故障,操作记录实时同步到 运维事件中心 控制台。故障协同处理使用条件 成功开通...

产品简介

什么是运维事件中心 运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能;一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应...

实时性能

当您需要持续监控RDS MySQL实例的性能时(例如进行数据库性能的实时诊断和优化),使用实时性能监控功能,能够实时查看数据库实例的性能指标和趋势,帮助您及时发现并处理潜在的性能问题。前提条件 实例为如下版本:RDS MySQL 8.0 高可用...

RAM子账号授权

AliyunGEMPReadOnlyAccess」-只读管理运维事件中心的权限:适用于事件、故障处理流转等人员,如运营、测试、产品、管理等角色人员;AliyunGEMPCoordinatorAccess」-具备运维事件中心的事件和故障协同功能权限,拥有其它模块的只读权限,如...

管理测试用例

本文介绍管理性能测试用例的操作方法。背景说明 执行性能测试时,在开始测试前或者测试结束后需要新建用例,用于保存测试数据。您可以申请远程真机进行性能测试,测试过程请参见 实施性能测试。新建目录 在页面左侧导航栏,选择 移动测试>...

自治服务概述

云数据库 OceanBase 的自治服务是一款面向开发、运维、DBA 的一站式智能诊断自治服务,为用户提供可视化监控、性能优化、故障诊断、安全管理、容量管理等能力,帮助用户更简单、更低成本、更高性能的使用 OceanBase 数据库。背景信息 传统...

什么是应用监控

ARMS应用监控是一款应用性能管理(Application Performance Management,简称APM)产品。您无需修改代码,只需为应用安装一个探针,ARMS就能够对应用进行全方位监控,帮助您全面掌控应用运行状态,快速定位出错接口和慢接口,洞察性能瓶颈...

应用场景

服务网格 ASM主要适用于需要对应用服务进行流量管理、安全管理故障恢复、观测监控以及微服务架构迁移的应用场景。本文介绍ASM的常见应用场景。流量管理 通过ASM,可以轻松实现基于配置的流量管理:将流量管理与基础设施管理分隔开来,并...

概述

通过 DST,运维人员、开发人员和架构师能看清楚复杂的大规模微服务架构下的应用及服务之间的 复杂调用关系、性能指标、出错信息 与 关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运...

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制台常见问题 网站耗资源(客户程序故障)常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

事件分析概述

以云服务器ECS为例,很多情况会因系统错误或云盘性能受损而触发故障类事件,这类事件通常会涉及到周边产品(比如容器服务ACK等),捕获全部云上事件做基础排障的挑战性比较大。事件总线EventBridge 支持全部云服务事件无缝接入,更大程度...

分布式链路概述

帮助运维人员、开发人员和架构师轻松应对复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维开发工作...

报警设置

为了不错失重要通知,建议您对重要的监控指标设置报警规则。当 云原生内存数据库Tair 性能指标(CPU、内存使用率等)异常或实例触发高可用切换时,云监控平台会向您发送警告信息。...相关文档 查看性能监控 查看并管理计划内事件 主备切换
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 云数据库 Redis 版 云安全中心 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用