为什么要做自动化

更新时间:2025-02-05 01:50:39

本视频介绍实现自动化的好处和价值。与传统手工管理相比,运维人员实现自动化能够更加合规、高效地完成基础设施管理,从而释放精力更好地支持业务创新。

为什么要做自动化

以下是视频转写全文,供参考:

哈喽大家好,欢迎回到阿里云开放平台自动化专栏Auto Talk,本期我们带来的是《为什么要做云上自动化》。我是夏槐,来自阿里云开放平台团队。

首先,我们看一下云上自动化的概念。自动化是指运用技术手段,在减少人工协助的情况下执行各项任务。而云上自动化,指运用云服务提供的大量OpenAPI,通过编程来定义和集成云上的计算、网络、存储和应用等能力,完成高阶的业务服务功能,从而形成资源管控到应用交付的全生命周期自动化。无论您是自研系统、还是购买ISV提供的系统,亦或是使用开源的工具和产品,都可以通过这样的方式来集成云服务。

那么,做自动化有什么好处呢?首先我们分析一下传统手工管理的痛点。

对于运维人员,机械化的处理工单,执行资源的创建、变更、释放操作,重复工作多,且容易出错,导致负责人频繁救火。

对于安全合规人员,被动审批,出现问题需要各种办法找证据追责。

对于财务人员,资源分类管理复杂,尤其是在达到一定的规模以后,分账和出账变得困难,有时只能让大家吃大锅饭。

以上这些问题,在高管看来,效率低、成本高、易出错,严重拖累业务发展。

自动化管理可以一定程度上解决以上痛点,在保障稳定、安全的前提下,提升IT服务效率。同时能够解放IT员工,让他们节省时间,去关注并解决更重要的问题。

首先,搭建自动化的一站式管理平台,所有数据和流程在平台上完成,避免人为误操作,然后设置统一的管控策略和安全合规策略,平台自动化执行,保障安全合规。因为是代码化的实现和运行,所有流程和数据可以被提前测试,提前预防故障,同时代码版本化管理,即使出现问题,也可以快速回滚恢复,保障了稳定性。

那么,有哪些场景可以自动化呢?

通常,一个新的业务项目上线有这些步骤:账号权限分配、资源供给和配置、应用配置和发布、日常运维(包括监控、变配、扩缩容等),同时要保障这些工作是串联在一个流程里的,最终生产出的资源和应用和团队以及人员是合理地绑定到一起的。这样才有利于合规审计、财务分账等场景的实施。

以上这些,都可以通过阿里云的一方或三方服务来支持。以基础设施管理为例,可以用ROS来定义资源模板,也可以用开源的Terraform来实现。您只需要声明好要定义的资源结构、资源属性,其他交给程序来实现,最终确保在云上交付与您定义一致的资源。更重要的是,这些资源 可以被持续的管理和治理,可以用同一套代码在不同的环境和项目中复用。这就是通常所说的infrastructure as code。类似地,对于权限策略或合规规则,有policy as code的解决方案,对于流水线定义,有pipeline as code的解决方案,在此不再一一赘述。

我们来看一个具体的客户案例,这个客户基于Terraform、GitLab、Luban(自研管理平台)实现了完整的基础设施自动化,将资源供应效率从原来的小时级降低到分钟级,运维支撑效率提升100%。整体实现的架构是这样的。

基于此架构,业务团队可以自助申请资源,而且能申请哪些资源,需要符合什么样的要求,规则都是事先定义好的。平台团队只需要做最终的code review和审批即可。

最后,我们做一个总结,为什么要做云上自动化,用一句话来说就是为了业务敏捷,为了更好地支持业务创新。

通过实施自动化,可以带来以下的好处:

从效率上来说,因为是代码化的实现,代码可复用,可以持续维护和治理;而且规模越大优势越明显;另外可以做产品间的组合编排;

稳定上 可以提前测试,提前避免问题;而且是版本化管理,随时可以恢复某个特定版本;从健壮性上考虑,如果出错了,程序可以尝试重试、自愈,这都是人工操作不具备的;

然后在安全合规上,从被动的审批追责,到主动的制定规则、自动化运行规则,可以最大化的规避问题发生;

以上就是本期分享的全部内容了,若您有任何疑问或关于云上自动化的想法,欢迎扫屏幕下方二维码加入钉群与我们交流,期待联系,我们下期再见!