重启集群

当 云数据库 SelectDB 版 集群出现异常情况,无法提供服务时,您可以重启该集群。本文介绍如何在 云数据库 SelectDB 版 实例中重启集群。前提条件 已创建 云数据库 SelectDB 版 实例。实例中存在目标集群。目标集群的状态为运行中。操作...

在程序中通过AnalyticDB MySQL版Client...数据到2.0集群

setRetryTimes(int retryTimes)设置提交时写入 AnalyticDB MySQL版 2.0集群出现异常时重试的次数,默认为0。setRetryIntervalTime(long retryIntervalTime)设置重试间隔的时间,单位是ms,默认为0。setCommitSize(long commitSize)设置自动...

集群监控概述

功能 使用场景 配置自定义报警策略 为避免出现集群状态异常、节点磁盘使用率过高等问题而影响Logstash服务,建议您进行监控报警配置,实时监控集群状态、节点磁盘使用率等信息,及时查收报警短信,提前做好防御措施。目前,Logstash支持在...

将报警配置功能接入注册集群

通过配置并查看 集群异常事件报警规则集 感知集群节点或容器节点异常。例如,集群节点Docker进程异常、集群节点进程异常及集群容器副本启动失败等异常。通过配置并查看 集群存储异常事件报警规则集 感知集群存储的变更与异常。通过配置并...

容器服务报警管理

背景信息 容器服务报警管理包含的功能:集群异常事件报警,此类报警的数据链路同步自容器服务事件中心。更多信息,请参见 事件监控。集群相关基础资源的关键指标报警,此类报警的数据链路同步自云监控基础资源监控。更多信息,请参见 基础...

集群变更概述

功能 使用场景 重启实例或节点 阿里云Elasticsearch提供了集群及节点重启功能,当集群状态出现异常,您可以根据集群的健康状态对集群进行重启或强制重启操作。更多内容请参见 重启实例或节点。升降配实例 当集群的配置无法满足您的业务需求...

集群状态

您可以在EMR on ECS页面查看集群的状态。本文为您介绍EMR on ECS集群的...终止失败 释放集群过程中出现异常。您可以在EMR on ECS页面,单击 状态 列的问号,查看异常原因,出现此状态时需要您重新单击集群操作列中的释放按钮,释放该集群

边缘节点FAQ

当 ACK Edge集群 的节点出现异常时,您可以参见以下步骤收集集群节点的诊断信息,以供数据分析使用。登录到 ACK Edge集群 的异常节点。执行如下命令,下载诊断脚本。curl-o/usr/local/bin/diagnose_edge_node.sh ...

安装脚本配置说明

可选值:true false isComputeNode true 是否计算节点,可选值:true false 异常处理 创建集群时可能会出现异常,常见异常说明如下:如果集群创建过程中出现异常,导致集群创建失败,则不会执行安装脚本。如果集群创建成功,但是单个计算...

重启实例或节点

当您需要修改实例或节点的配置,或者遇到集群或节点出现异常等情况时,可能需要重启阿里云Elasticsearch实例或节点。本文介绍如何通过控制台重启阿里云Elasticsearch实例或节点。前提条件 确保实例的 状态 为正常(绿色)、索引至少包含1个...

ack-node-repairer

rules.detector.conditionType是集群出现异常Condition。当设置rules.detector.paused为 true 时,此问题的自愈功能将被关闭。至此,当集群节点上有NTP服务异常时,ACK的自愈框架将会通过 OOS 到节点上执行 systemctl restart chronyd....

客户端访问Elasticsearch FAQ

如果出现集群状态不健康、节点失联等问题,需要先解决这些集群层面的问题,详细信息请参见 指标含义与异常处理建议。判断客户端是否有网络拦截策略。您可以分别在用户侧、Elasticsearch服务端、SLB端抓包进行排查,如果这些都没有异常,还...

集群管理FAQ

当Kubernetes集群出现问题或者节点异常时,您可通过容器服务ACK提供的一键故障诊断功能,辅助您定位集群中出现的问题,详情请参见 使用集群诊断。如果集群诊断功能无法满足需求,您需要分别在Master节点和异常的Worker节点上收集Kubernetes...

使用Prometheus配置报警规则的最佳实践

报警规则说明 ACK从集群稳定性、集群节点异常集群节点水位、应用容器副本异常、工作负载异常、存储异常、网络异常等多个方面,通过集群、应用的运维经验沉淀,总结梳理出以下Prometheus重要报警规则配置。报警规则包含容器副本异常、工作...

配置专属集群告警

参数 说明 集群异常状态通知 选择集群处于异常状态时,是否需要发送告警。打开:发送告警。关闭:不发送告警。DU使用率(集群级别)设置集群的DU使用率,取值范围为1%~200%,默认为80%。当集群的DU使用率达到该值时,发送告警。说明 当前只...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

集群防御规则可拦截状态异常排查

集群防御规则的可拦截状态为异常或正常待确认时,该集群防御规则无法对访问该集群异常流量进行告警或者拦截。本文介绍如何处理集群防御规则的可拦截状态为异常或正常待确认的问题。前提条件 已为该集群创建了防御规则。创建防御规则的...

扩容

集群扩容 当您的集群出现数据业务瓶颈时可以选择扩容操作,当前集群只支持水平扩容。首先进入 集群管控页,点击集群管理>选择相应的集群>点击右上角“扩容”按钮。在扩容详情页面,从新增资源下拉选项框选择需要增加的Broker数量。首先勾选...

网络管理FAQ

Kubernetes集群中Pod出现网络异常 如何确认Kubernetes集群内应用的出网地址 Kubernetes集群中访问LoadBalancer暴露出去的SLB地址不通 如何提升Linux连接跟踪Conntrack数量限制?Service FAQ SLB相关 创建Service时,Local和Cluster两种外部...

缩容集群数据节点

常见问题 缩容集群数据节点时,出现“该操作会导致当前集群资源(Disk/CPU/Memory)不足或shard分配异常”的报错,如何处理?缩容集群数据节点时,出现集群当前状态异常或有未完成任务”的报错,如何处理?缩容集群数据节点时,出现...

E-MapReduce创建失败

以下列举出常见集群创建失败的原因以及对应解决方案,帮助您在集群创建失败时可以通过FAQ来解决部分问题 一、问题:创建集群出现弹窗错误:Your account does not have enough balance 原因:余额需要大于100元,才能正常创建集群 二、问题...

2022-05-16版本

针对Session集群异常导致作业无法操作的问题,我们通过强制停止能力来停止Session集群。配置开发测试环境(Session集群)JM异常智能分析 当Flink作业运行发生异常时,TM的异常会被JM收集到日志中,通常通过作业探查中的异常日志,就可以...

阿里云Elasticsearch实例FAQ

缩容集群数据节点时,出现“该操作会导致当前集群资源(Disk/CPU/Memory)不足或shard分配异常”的报错,如何处理?缩容集群数据节点时,出现集群当前状态异常或有未完成任务”的报错,如何处理?缩容集群数据节点时,出现“保留节点数需...

基础资源监控

配置报警规则时,选择 资源范围 为 集群 或 节点,配置以整个集群集群任一节点出现指标异常时的报警规则。选择节点时配置 全部 节点,则当该集群的任一节点出现规则描述中的指标异常时,将触发报警。异常容器水位状况,以对应集群下的任...

查看集群信息

ACS集群提供集群信息页面...重要 这些资源由阿里云容器计算服务进行管理,请勿随意删除或自行修改,避免集群异常,影响集群内应用的正常运行。任务日志 查看集群任务、任务状态、变更时间等。失败任务将提示失败信息,协助问题的排查和诊断。

容器防护设置

开启容器K8s威胁检测能力后,云安全中心将为您开启 容器集群异常 类型告警的检测。云安全中心支持的检测项详情,请参见 容器K8s威胁检测项。版本限制 仅云安全中心的旗舰版支持该功能,其他版本不支持。购买和升级云安全中心服务的具体操作...

启用集群检查

警告:需要确认,引起集群异常的情况需要处理。异常:尽快处理,避免集群无法正常工作。针对单项检查结果,可以单击状态颜色框,查看检查对象信息及具体检查结果。检查结果包含检查内容、可能影响以及推荐的修复方案。您可以参考异常影响及...

容器网络FAQ

Kubernetes集群中Pod出现网络异常 如何规划集群网络?ACK是否支持hostPort的端口映射?如何查看集群的网络类型及对应的虚拟交换机?如何查看集群中使用的云资源?如何确认Kubernetes集群内应用的出网地址 Kubernetes集群中访问LoadBalancer...

PolarDB代理配置与流量异常

PolarDB 集群支持读写分离方式接入业务,但在实际业务场景中,经常出现节点上流量负载不均,可能导致单节点承担大量的流量从而被拖垮,最终造成整个集群雪崩。本文主要描述 PolarDB 代理的配置方法以及流量不均时如何定位处理。数据库代理...

使用集群检查

警告:需要确认,引起集群异常的情况需要处理。异常:尽快处理,避免集群无法正常工作。针对单项检查结果,可以单击状态颜色框,查看检查对象信息及具体检查结果。检查结果包含检查异常内容、可能影响以及推荐的修复方案。您可以参考异常...

管理用户

具有sudo权限的用户如果操作错误(如误删除E-HPC软件栈模块),会导致集群异常。用户组 说明 普通权限组 适用于只有提交、调试作业需求的普通用户。sudo权限组 适用于需要管理集群的管理员。除提交、调试作业外,还可以执行sudo命令进行...

全球数据库常见问题

如果无法接受从集群出现延迟,可以直接切换连接主集群的地址进行访问。什么是GDN集群跨地域延迟?GDN集群跨地域延迟的详情介绍请参见 跨地域低延时同步。说明 GDN网络中所有集群的数据保持同步,网络中每个集群均提供读写服务,并且提供...

查看集群信息

重要 这些资源由阿里云容器服务进行管理,请勿随意删除或自行修改,避免导致集群异常,影响集群内应用的正常运行。集群监控 对接阿里云可观测监控 Prometheus 版,对集群进行资源监控,支持快速查看负载的CPU、内存、网络等指标的使用率,...

概述

当主集群出现地域级别的故障时,您只需要手动将您的业务切换到从集群。说明 主从集群切换在10分钟之内完成(实际测试5分钟以内),切换过程中,可能会出现60秒以内的连接闪断。建议您在业务低谷期执行切换操作并确保应用具备重连机制。请求...

查看集群信息

重要 这些资源由阿里云容器服务进行管理,请勿随意删除或自行修改,避免导致集群异常,影响集群内应用的正常运行。集群监控 对接阿里云可观测监控 Prometheus 版,对集群进行资源监控,支持快速查看负载的CPU、内存、网络等指标的使用率,...

查看集群信息

重要 这些资源由阿里云容器服务进行管理,请勿随意删除或自行修改,避免导致集群异常,影响集群内应用的正常运行。集群监控 对接阿里云可观测监控 Prometheus 版,对集群进行资源监控,支持快速查看负载的CPU、内存、网络等指标的使用率,...

查看集群信息

重要 这些资源由阿里云容器服务进行管理,请勿随意删除或自行修改,避免导致集群异常,影响集群内应用的正常运行。集群监控 对接阿里云可观测监控 Prometheus 版,对集群进行资源监控,支持快速查看负载的CPU、内存、网络等指标的使用率,...

事件监控

您可以通过使用NPD结合SLS的Kubernetes事件中心、配置NPD集群检查项以及异常事件离线功能、使用钉钉、使用SLS离线Kubernetes事件及使用EventBridge离线Kubernetes事件,实时监控集群异常与问题。费用说明 ACK事件监控功能默认上报集群...

集群检查项及修复方案

重要 误删除APIService会导致集群异常。如果您不清楚异常APIService用途,请 提交工单 联系我们。kubectl-n kube-system delete apiservices${your-abnormal-apiservice-name} 集群中存在废弃API 判断废弃API的来源,对废弃API采取对应处理...

通过CCR跨集群复制解决跨集群容灾场景

如果您的Elasticsearch(简称ES)集群出现灾难性事件,例如,硬件故障、软件错误、数据中心故障、自然灾害或其他导致服务中断的情况,您可以通过跨集群复制CCR(Cross Cluster Replication)功能将容灾集群丢失数据恢复。背景信息 CCR是...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库专属集群 云原生数据仓库AnalyticDB MySQL版 Web应用防火墙 云数据库 Redis 版 云解析DNS 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用