上云后,基础设施的底层运维工作由阿里云负责,您只需关注如何让云产品更好地服务于不断变化的业务。阿里云有多项服务可以帮助您用好云,包括快速创建、批量运维、实时监控等。

创建资源

云服务器ECS有多种创建方式,您可以根据不同的资源数量以及需求,来选择不同的创建方式,从而快速、高效、低成本地创建出想要的资源。

创建的ECS实例数量 需求场景 推荐的创建方式 相关操作
少量(几台) 简单便捷的操作方式 根据向导创建,创建一台或多台实例(上限为100台)。支持所有计费方式。
较多(几十台以上) 购买相同配置的实例,最多支持500台。 在已有实例的基础上购买相同配置的实例,提高在特定场景下横向扩展的效率。 购买相同配置的实例
批量创建实例 实例启动模板是用于快速创建实例的模板。模板可以存储除了密码以外的任意配置信息,包括密钥对、RAM角色、实例类型和网络设置等,能够满足不同场景的个性化需求。 使用实例启动模板创建实例
有大规模的弹性需求(1~1000台),兼顾低成本。
  • 使用弹性伸缩服务,可以根据业务需求和策略自动调整计算能力,增加或减少指定类型的实例。该方式只能创建按量付费或者抢占式实例。
  • 使用弹性供应组功能,可快速交付大量的实例。弹性供应提供多种供应策略,有效缓解抢占式实例被回收对业务的影响,让您更稳定地使用低价算力。该方式只能创建按量付费或者抢占式实例。
自动创建多种云计算资源 使用资源编排ROS,根据模板自动完成所有资源的创建,一次性同时交付ECS及其他云计算资源,实现自动化部署及运维。 使用Count功能批量创建资源

监控与运维

监控

监控您的ECS实例是否健康非常重要,您需要确保用户始终可以快速打开您的网站和应用,或者快速完成数据处理和渲染等任务。阿里云提供了监控数据收集、可视化以及实时监控告警等服务,确保您的实例始终处于正常的运行状态。
适用对象 说明 相关操作
入门 您可以通过ECS自带监控服务和云监控服务监控实例。ECS自带监控服务提供vCPU使用率、网络流量和磁盘I/O监控。云监控可以提供更加精细化的监控粒度。 查看实例监控信息
高阶 云监控通过在ECS上安装插件,为您的ECS提供监控功能。丰富的监控项,满足主机的基本运维需求。同时提供业务级进程监控、图形化GPU监控以及灵活的报警服务,让您全面了解主机的资源使用情况,极大降低监控成本。
在使用ECS时,您可以通过事件通知来监控资源变化,被通知的事件可以是系统事件(包括运维事件和异常故障)、实例状态变化、挂载和卸载数据盘、创建快照等。通过设置事件通知,您还可以为事件配置消息处理中间件,实现事件驱动的自动化运维,取代SDK轮询的方式。

运维

在使用云服务器ECS时,阿里云提供了云助手、运维编排服务、资源编排ROS等自动化运维方式,帮助您更好的自动化管理和执行运维任务。
适用对象 推荐方式 相关操作
入门 云助手

云助手是阿里云ECS官方提供的自动化运维通道,通过云助手可免密码、免公网IP、免跳板机,实现在ECS实例上执行命令(Shell、PowerShell和Bat等)和发送文件等操作。典型的使用场景包括:安装卸载软件、启动或停止服务、部署应用、分发配置及执行一般的命令(或脚本)等。

高阶 OOS自动化运维和批量管理
运维编排服务OOS(Operation Orchestration Service)能够自动化管理和执行运维任务。使用OOS可提高运维工作的整体效率,也能增强运维的安全性。运维编排服务OOS常见的应用场景包括:
  • 定时和批量的运维场景。例如,批量检查ECS实例中的云盘剩余空间。您可以通过名字匹配、标签分组、资源组分组等方式选择需要检查的ECS实例列表,再通过云助手命令执行云盘检查,最终统一查看结果。
  • 事件驱动的自动化场景。例如,当某台ECS实例的vCPU使用量达到了85%时,为了防止业务中断,可以通过运维编排服务OOS自动重启ECS实例。
  • 跨地域的运维场景。例如,您可以将一批ECS实例借助镜像从一个地域复制到另一个地域。
  • 需要审批的场景等。例如,在购买或释放ECS实例任务前设置审批流程。
ROS自动化部署和运维

资源编排ROS(Resource Orchestration Service)是一项简化云计算资源管理的服务,ROS编排引擎能根据资源栈模板创建和配置资源,自动化交付项目所需的ECS实例和RDS实例等云计算资源。