ack-node-problem-detector

ack-node-problem-detector是ACK基于社区开源项目进行改造和增强的集群节点异常事件监控组件,同时支持对接第三方监控平台,承载ACK集群的节点异常发现以及事件中心的功能。您可以根据需求使用该组件加入定制化的节点监控插件,扩大节点...

【组件升级】NPD升级公告

为了提升集群的稳定性,建议您将ACK NPD(ack-node-problem-detector)组件升级到1.2.8版本以上。背景信息 低于v1.2.8版本的ack-node-problem-detector组件会默认开启文件系统句柄巡检项(check_fd),check_fd的进程在读取大内核数据时,...

故障恢复

PROBLEM_UPDATE 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 返回数据 名称 类型 ...

故障取消

cancelReason Long Body 否 取消原因 取消原因 problemNotifyType Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 ...

故障撤销恢复

NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 clientToken String Body 否 FD200FAE-E98F-496E-BFE6-...

更新故障通告

故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 problemId Long Body 否 1312 故障Id clientToken String Body 否 4361a0e1-6747-4834-96ce-0c4840fd3812 幂等校验Id ...

故障动态

PROBLEM_IN_REVIEW 完结 PROBLEM_REOPENED 取消 PROBLEM_CANCEL 更新故障通告 PROBLEM_UPDATE_NOTIFY 添加故障小计 PROBLEM_ADD_SUBTOTAL 更新故障 PROBLEM_UPDATE problemId Long 12312 故障Id problemName String 这是一个故障 故障名称 ...

故障详情动态

RESTORE 复盘 PROBLEM_IN_REVIEW 完结 PROBLEM_REOPENED 取消 PROBLEM_CANCEL 更新故障通告 PROBLEM_UPDATE_NOTIFY 添加故障小计 PROBLEM_ADD_SUBTOTAL 更新故障 PROBLEM_UPDATE snapshotData String {“userName”:"小明"} 快照数据 {...

码表配置

PROBLEM_INJECTION_CODE_RELEASE</code> <parentCode>PROBLEM_INJECTION_MODE</parentCode> <name>代码发布</name><require>0</require><id>29</id><value>代码发布</value><key>1</key></PROBLEM_INJECTION_MODE></data></...

故障影响服务详情

data":{"effectionServiceId":6442430,"serviceName":"哈哈","serviceId":170000000,"description":"ew","picUrl":["[\"problem/axxxxxx2-1xxxx4565-be92-f44ae2xxxxx\",\"problem/7xxxxxxe314-49998-b9e7-399e78b41fbd\",\"problem/xxxxx...

获取故障通知预览

UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 problemLevel String Body 否 P2 故障等级 effectServiceIds Array of Long Body ...

事件中心

问题事件 事件code 事件名称 事件等级 云监控事件名称 事件说明和影响 用户侧处理建议 公网实例 problem-internetBandwidthOverlimit 公网带宽超限丢包 严重 实例带宽超限丢包 公网实例的实际带宽流量超出了当前带宽规格,出现丢包情况。...

枚举字典接口

UPDATE","desc":"故障更新"},{"code":"PROBLEM_UPGRADE","desc":"故障升级"},{"code":"PROBLEM_DEGRADE","desc":"故障降级"},{"code":"PROBLEM_RECOVER","desc":"故障恢复"},{"code":"PROBLEM_REISSUE","desc":"故障补发"},{"code":...

获取故障图片链接

50002021 故障id 返回数据 名称 类型 示例值 描述 requestId String c26f36de-1ec8-496a-a828-88067879ef81 requestId data Object data links Array of urls 图片链接列表 key String problem/xxxxxxxxxx-484d-4242-b9cf-xxxxxxxxxx oss ...

事件监控

方法一:已安装node-problem-detector并创建事件中心 如果您在创建集群时,已选中 安装node-problem-detector并创建事件中心,请按照以下步骤查看Kubernetes事件中心。关于通过创建集群,安装node-problem-detector并创建事件中心的详细...

更新故障复盘改进详情

recentActivity String Body 否 2 最近活动码表:PROBLEM_RECENT_ACTIVITY injectionMode String Body 否 1 注入方式码表:PROBLEM_INJECTION_MODE recoveryMode String Body 否 2 恢复方式码表:PROBLEM_RECOVERY_MODE discoverSource ...

故障复盘改进详情

PROBLEM_RECENT_ACTIVITY injectionMode String 3 注入方式码表:PROBLEM_INJECTION_MODE recoveryMode String 2 恢复方式码表:PROBLEM_RECOVERY_MODE discoverSource String 1 发现来源码表:PROBLEM_DISCOVER_SOURCE userReport Long 1 ...

自动监控和响应ECS系统事件

name:node-problem-detector-config namespace:kube-system node-problem-detector.yaml apiVersion:apps/v1 kind:DaemonSet metadata:name:node-problem-detector namespace:kube-system labels:app:node-problem-detector spec:selector:...

更新故障时间线

PROBLEM_KEY_NODE content String Body 否 故障分析 节点内容 time String Body 否 2021-01-08 10:10:10 发生时间 problemId Long Body 否 234 故障id clientToken String Body 否 c26f36de-1ec8-496a-a828-880676c5ef81 幂等标识 返回数据...

故障完结

HttpCode 错误码 错误信息 描述 400 ProblemStatusError The problem status is abnormal.故障状态异常 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。

故障复盘

故障复盘 调试 您可以在OpenAPI Explorer...4361a0e1-6747-4834-96ce-0c4840fd3212 幂等token 返回数据 名称 类型 示例值 描述 requestId String B81E84B5-8FD1-45F3-969A-B5067AADCFFF Id of the request 示例 请求示例 POST/problem/replay ...

创建影响服务

status String Body 否 UN_RECOVERED 影响状态 0 未恢复 1已恢复 description String Body 否 erdwcdc 影响描述 pictureUrl Array of String Body 否 problem/xxxxxxxssxxxa2c8-40b9-9162-08a6c2e338e2 图片key problemId Long Body 是 ...

查询故障时间线列表

INJECTION,PROBLEM_HAPPEN 关键节点 码表:PROBLEM_KEY_NODE(逗号分隔)content String 内容 内容 isKey Boolean true 是否是关键字 true是 false不是 默认 false updateTime String 2020-08-08 15:38:38 修改时间 time String 2020-08-08 15...

更新故障影响服务

status String Body 否 UN_RECOVERED 影响状态 0 未恢复 1已恢复 description String Body 否 xxxx大厦 影响描述 picUrl Array of String Body 否 problem/xxxxxxxx-a2c8-40b9-9162-08a6c2e338e2 图片key problemId Long Body 否 190000000...

更新故障改进措施

HttpCode 错误码 错误信息 描述 404 ProblemNotExisted The problem does not exist.故障不存在 404 ProblemMeasureNotExisted The problem measure does not exist.故障措施不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多...

创建故障时间线节点

PROBLEM_KEY_NODE content String Body 否 时间线内容XXXX 节点内容 time String Body 否 2021-06-06 12:11:22 发生时间 clientToken String Body 否 601FA6A2-AC5C-4B59-BE11-378FTOKENA11 幂等标识 返回数据 名称 类型 示例值 描述 ...

创建并使用K8s事件中心

阿里云Kubernetes配置方式 如果是ACK集群,则对应阿里云Kubernetes组件中的ack-node-problem-detector组件已集成eventer和node-problem-detector功能,您只需要部署该组件。更多信息,请参见 事件监控。如果是 ACK Serverless集群,您需要...

Dynatrace

步骤二:新增报警媒介 登录 Dynatrace控制台,在左侧导航栏选择 setting>Integration>Problem notifications。在 Problem notifications 页面单击 Add notifications,添加一个事件通知,设置相关参数,然后单击 Save 进行保存。Display ...

Dynatrace

步骤二:新增报警媒介 登录 Dynatrace控制台,在左侧导航栏选择 setting>Integration>Problem notifications。在 Problem notifications 页面单击 Add notifications,添加一个事件通知,设置相关参数,然后单击 Save 进行保存。Display ...

删除故障

请求语法 POST/problem/delete HTTP/1.1 请求参数 名称 类型 位置 是否必选 示例值 描述 Object Body 否 A short description of struct problemId Long Body 否 1231 故障Id clientToken String Body 否 4361a0e1-6747-4834-96ce-0c4840fd...

故障升级

新增故障 调试 您可以在OpenAPI Explorer中直接运行该接口,...示例值 描述 requestId String E789D869-DB13-4933-BAA8-A1F56F94B94D Id of the request data Object data problemId Long 321331 故障Id 示例 请求示例 POST/problem/upgrade ...

将事件中心接入注册集群

onectl ram-user grant-addon ack-node-problem-detector 预期输出:Ram policy ack-one-registered-cluster-policy-ack-node-problem-detector granted to ram user ack-one-user-ce313528c3 successfully.通过控制台配置 在注册集群中...

故障图片上传获取签名信息

67876 故障id 返回数据 名称 类型 示例值 描述 requestId String e2d4306a-bf4d-4345-9ae6-158223c85dbd requestId data Object data bucketName String xxxx-xxxx-xxxx oss bucket name key String problem/xxxxxxxxxxxxxxxx1-b3185d...

删除影响服务

876 故障id clientToken String Body 否 e0b6735e-1a04-4d6b-a625-d2350612492c clientToken 返回数据 名称 类型 示例值 描述 requestId String e0b6735e-1a04-4d6b-a625-d2350612492c Id of the request 示例 请求示例 POST/problem/...

删除故障改进措施

4361a0e1-6747-4834-96ce-0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3812 Id of the request 示例 请求示例 POST/problem/improvement/measure/delete ...

DescribeOnceTask-查询客户端任务列表

取值:CLIENT_PROBLEM_CHECK:客户端任务 CLIENT_DEV_OPS:云运维任务 ASSET_SECURITY_CHECK:资产采集任务 说明 TaskType 和 RootTaskId 不能同时为空 CLIENT_PROBLEM_CHECK RootTaskId string 否 根任务 ID。说明 TaskType 和 RootTaskId...

故障新增备注小计

6747-4834-96ce-0c4840fd3814 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd381A Id of the request data Object object subtotalId Long 123 小计id 示例 请求示例 POST/problem/save...

删除故障事件线节点

删除故障事件线节点。...601FA6A2-AC5C-4B59-BE11-378FTOKENA11 幂等标识 返回数据 名称 类型 示例值 描述 requestId String 10REQUES-AC5C-4B59-BE11-378F117A6A88 Id of the request 示例 请求示例 POST/problem/process/timeline/delete ...

故障小计列表

故障小计列表。调试 您可以在OpenAPI Explorer中直接运行该接口,...} 错误码 HttpCode 错误码 错误信息 描述 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。

批量创建时间节点

批量创建时间节点。调试 您可以在OpenAPI Explorer中直接运行...AC5C-4B59-BE11-378F117A6A88 id of the request data Object data problemTimelineIds Array of Long 435 时间线id 示例 请求示例 POST/problem/process/timeline/batchCreate ...
共有35条 < 1 2 3 4 ... 35 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用