自动化任务
|
功能集 |
功能 |
功能描述 |
参考文档 |
|
运维模板 |
管理运维模板 |
OOS使用模板来定义所需要编排的运维操作,模板内容支持流程配置、YAML和JSON三种格式,模板分为公共模板和自定义模板两种类型。 |
|
|
创建执行 |
您可以对公共模板或自定义模板创建执行,同时OOS支持多种执行方式便于您更好地使用。 |
||
|
管理执行 |
对于创建的执行,您可以进行查看、克隆、取消、删除等操作。 |
||
|
执行记录投递 |
执行记录投递功能可以将您在系统运维管理中创建的执行记录投递到对象存储OSS或日志服务SLS进行持久化存储,以便对执行记录进行查询、行为分析、安全分析、资源变更行为追踪和行为合规性审计等操作。 |
执行记录投递 | |
|
常见运维场景 |
定时运维任务 |
当您需在某个时间点做一些运维操作时,通过OOS定时运维可轻松搞定,当前支持的定时类型包括仅在指定时间执行一次,以及周期性重复执行。 |
定时运维 |
|
告警运维任务 |
系统运维管理 OOS(CloudOps Orchestration Service)支持创建云产品监控指标阈值报警运维任务。当我们监控到云产品资源的监控指标达到指定的阈值后,执行指定的模板,进行告警运维。告警运维任务会一直执行并监控,直到您取消它。比如您可以在监控到磁盘利用率超过80%时清理日志目录下的文件。 |
创建告警运维任务 | |
|
事件运维任务 |
系统事件代表了云产品资源状态的变更,比如ECS实例发生了异常重启、ECS实例被释放、快照创建完成、将要执行运维等等。系统运维管理支持创建事件运维任务,在系统事件发生时,执行指定的模板,进行事件运维。事件运维任务会一直执行并监听新事件,直到您取消它。 |
创建事件运维任务 |
参数仓库
|
功能集 |
功能 |
功能描述 |
参考文档 |
|
普通参数 |
管理普通参数 |
使用阿里云的产品时,期望可以存储常用的参数以及某些可配置化的值,而且没有保密要求。可以在系统运维管理 OOS(CloudOps Orchestration Service)的参数仓库中创建、搜索、更新普通参数。 |
普通参数 |
|
加密参数 |
管理加密参数 |
使用阿里云的产品时,除了与普通参数相似的需求外,还有加密参数,它还可以将保存的值以KMS服务进行加密。本示例介绍如何在参数仓库中创建、搜索、更新加密参数。 |
加密参数 |
|
公共参数 |
使用公共参数 |
对于一些阿里云基础设置的配置,例如ECS镜像族中最新的镜像ID信息等,OOS提供了公共参数来存储这些公共信息。 |
|
|
参数的使用 |
参数的使用 |
OOS、ROS、云助手命令中支持引用OOS普通参数、加密参数和公共参数。 |
服务器管理
|
功能集 |
功能 |
功能描述 |
参考文档 |
|
补丁管理 |
补丁基线 |
补丁管理服务针对每一种操作系统都配置了预定义的默认补丁基线。当您需要针对某一个操作系统创建自定义的扫描和安装规则的时候,需要用到补丁基线模块。补丁基线定义了您在实例上安装的补丁规则,可以指定: 1. 操作系统的产品类型 2. 补丁的分类 3. 补丁的严重级别 4. 自动批准的条件。 |
|
|
补丁修复 |
当您有扫描或安装补丁的需求时,通过OOS补丁管理操作可轻松搞定。补丁管理支持两种触发模式:1. 立即修复,2. 定时修复。 |
||
|
配置清单 |
管理配置清单 |
使用阿里云系统运维管理(OOS)的配置清单功能来收集和管理阿里云计算环境中ECS实例的元数据。这包括一系列数据类型,如应用程序信息、网络配置、服务、文件系统数据、Windows特定数据和实例细节等。 |
|
|
处理配置清单数据 |
在创建了配置清单之后,您可以用聚合查看存量清单数据的汇总情况。比如,您对100台实例来配置了收集应用信息。通过聚合,您就能看到在100台实例中安装的各应用的精确计数。 同时Inventory也支持Filter,通过指定应用属性,可以进一步筛选结果,仅查看匹配到的属性聚合情况,比如筛选安装了应用名称为curl的情况统计。 |
配置清单数据的聚合及筛选 | |
|
扩展程序 |
安装/卸载扩展程序 |
在系统运维管理OOS中,支持用户根据自己的需求和特定应用场景开发自定义扩展程序,或者将其发布为公共扩展程序供其他人使用。在创建扩展程序后,用户在OOS中新建扩展程序任务,可针对单个或者多个ECS实例安装或卸载扩展程序。 |
安装/卸载扩展程序 |
|
创建自定义扩展程序 |
在系统运维管理OOS中,用户可以根据自己的需求和特定应用场景创建自定义扩展程序。在创建扩展程序后,用户在OOS中安装扩展程序任务。 |
创建自定义扩展程序 | |
|
更新自定义扩展程序 |
OOS支持您通过更新自定义扩展程序修改扩展程序信息。 |
更新自定义扩展程序 | |
|
发布为公共扩展程序 |
自定义扩展程序发布为公共扩展程序时,需要指定将自定义扩展程序的哪一个版本发布为公共扩展程序。首次发布为公共扩展程序时,系统会自动建立该公共扩展程序的v1版本,后续更新时依此类推。 |
发布公共扩展程序 |
应用管理
|
功能集 |
功能 |
功能描述 |
参考文档 |
|
应用配置 |
创建/删除应用 |
应用管理支持创建或删除应用。支持通过新建资源或者导入已有资源创建应用;用户可以选择通过应用模板部署应用、在应用市场部署第三方应用,也可以通过ROS模板部署自定义的应用;支持标签和资源组等多种资源导入方式。 |
- |
|
更新应用 |
应用管理支持修改应用的高级配置以及应用的描述信息。 |
- |
|
|
应用分组配置 |
创建/删除应用分组 |
在应用里用户可以灵活创建多个应用分组,比如按环境部署测试环境、预发布环境和生产环境分组。应用分组可以属于不同的地域。 |
- |
|
更新应用分组 |
应用管理支持修改应用分组的名称。 |
- |
开源与生态
|
功能集 |
功能 |
功能描述 |
参考文档 |
|
Terraform |
Terraform |
Terraform是一种开源工具,用于安全高效地预览,配置和管理云基础架构和资源、构建、变更、和安全有效的版本化管理基础设施的工具。可以通过Terraform高效的创建和配置OOS云资源。 |
使用Terraform操作OOS |
全局设置
|
功能集 |
功能 |
功能描述 |
参考文档 |
|
快速设置 |
快速设置 |
快速设置是基于运维最佳实践的智能化配置功能,帮助用户快速完成常见运维场景的标准化部署。支持跨账号、跨地域批量执行主机管理、监控插件部署、配置清单采集、补丁扫描与修复等任务。相比手工配置,快速设置大幅简化操作流程,降低复杂度,确保多账号多地域的运维策略高度一致,满足企业级规范化管理需求。 |
- |
运维中心
|
功能集 |
功能 |
功能描述 |
参考文档 |
|
运维项管理 |
运维项 |
运维项是 OOS「运维中心」的核心概念,代表需要调查和修复的操作问题,即运维人员的待办事项。运维中心可自动聚合多阿里云服务中的运维项至统一平台,实现集中查看、跟踪与修正,降低平均解决时间并减少操作错误。运维项支持通过默认规则、自定义事件总线规则自动创建,也支持手动创建,便于及时处理各类运维任务。 |
- |
|
运维配置管理 |
运维配置 |
运维项配置是创建运维项时需填写的属性集合,用于描述和分类问题。包括:名称、来源(可选)、优先级(1-5,数字越小越优先)、严重程度(低/中/高/严重)、类别(可用性/成本/性能/恢复能力/安全性)、描述(可选)及关联资源(可选)。运维项生命周期包含待处理、处理中、已解决三种状态,方便团队跟踪处理进度。 |
- |
AI助手
|
功能集 |
功能 |
功能描述 |
参考文档 |
|
ChatOps |
监控分析 |
支持通过对话实时查询云资源的性能指标(如 CPU 使用率、网络流量等),自动生成可视化图表,并结合上下文给出异常检测与优化建议。 |
- |
|
跨平台集成 |
集成钉钉、企业微信机器人,支持在 PC 端与移动端统一进行运维操作,实现多平台协同、随时随地管理云资源。 |
- |
|
|
安全管理 |
所有写操作(如删除实例、停止服务等)默认触发二次确认机制,结合 RAM 角色权限体系实现细粒度权限控制,确保关键操作安全可靠。 |
- |
|
|
资源运维 |
自动识别操作需求并调用相应 OpenAPI 完成资源创建、变更等操作,实现“自然语言驱动运维”的端到端自动化运维,支持ECS、RDS、OSS、VPC等核心产品、常规运维操作; |
- |