用云成本需求分析

更新时间:

实施用云成本规划首先要全面获取用云成本需求。在计划阶段,通过对用云成本进行需求分析,确保相关人员的业务需求都被识别和跟踪,并在规划和实施阶段有针对性的采取措施,使资源利用率达到最优,进而使用云成本在组织内部做到可管可控、可持续经营。

捕获成本需求

企业级客户主要从以下几个方面获取用云成本需求:

  • 业务地域性

  • 合规性

  • 安全性

  • 业务连续性和稳定性

  • 技术团队管理

  • 自动化和标准化

  • 成本优化目标

分析成本需求

业务地域性

选择云地域,在全球跨国企业的客户上云过程中,选择一个或者多个云区域,是一个重要的决策过程,涉及到成本需求的各个方面。您在创建或者购买阿里云资源时需要选择部署地域,资源创建或购买成功后不能更换地域。选择地域可以考虑的因素有,和客户自有IDC的连通需求可以选择就近的地域。业务终端客户所在的地域,比如某亚洲企业在本地和上海都有仓库,上海的仓库的管理系统按照就近接入原则部署在阿里云上海地域。同时地域的选择也要考虑地域之间网络专线和数据传输的成本。

合规性

企业会面临外部对企业云上信息系统的合规要求,如等保2.0, 3.0法规要求,同时当云上资源达到一定规模时,在内部会制定合规管控的基线,满足自身管理效率和安全合规的需求,包括记录云上资源管理的操作日志、资源。

配置变更日志,还需依赖云平台提供的持续监控和自动告警能力,实现合规性的自主监管。 企业级客户面向云上资源的操作审计和配置审计涉及到配置审计、操作审计、函数计算、SLS、OSS 等服务的实践操作。操作审计的操作日志投递到相应地域的 SLS 或 OSS,根据您日志的具体量级会产生不同的存储费用。

安全性

安全性是企业选择基础设施中最重要也是必不可少的需求之一,同时也是影响成本的重要因素之一。 安全性措施可保护组织的重要数据,防止数据和信息泄露,同时安全防御功能保障了业务的完整性和可用性,防止系统受到外在的攻击和被滥用。

将安全性要求纳入云成本分析的一部分,安全性涉及到数据中心安全,网络安全,数据安全,身份安全,安全防御体系等多方面,例如身份验证、MFA、这些选项会增加成本。云基础网络架构设计中涉及的云安全组,云防火墙,Anti-DDos 和应用安全产品也会增加成本。并且安全的监控和运营以应对复杂的安全环境也是安全的考虑因素。阿里云的云安全中心提供了良好的企业级安全监控和运营功能。

日志的存储和安全的审计,也是为了应对安全和监管要求必要的选型。

数据备份是另一个为了满足安全要求而进行的必要的操作,按照数据安全的合规,企业有可能会增加数据备份的频率,数据备份选择的工具的实效性,数据存储和带宽都是会影响成本的约束。

要了解安全性注意事项,请参阅安全合规支柱

业务稳定性和连续性

企业级应用不论是对内部客户提供服务的,还是对外部用户提供服务, 业务都具有必须要满足的服务级别协议, 根据业务的稳定性和连续性需求,需要创建高可用性和灾难恢复策略。

为了可用性要求,总体服务水平协议 (SLA)、恢复时间目标 (RTO) 和恢复点目标 (RPO) 可能会重新制定云基础架构和产品选择。 例如,你可能会选择跨区域托管应用程序,此选择的成本比单个区域托管应用程序更高,但支持高可用性。例如您可能会选择多可用区部署的数据库产品。

通常情况下,如果高可用性的成本超过了应用程序故障时间的成本,则说明你可能过度设计了高可用性策略。 相反,如果高可用性的成本低于合理故障时间的成本,那么你可能需要做出更多投入。

假设故障时间成本相对较低,那么你可以通过恢复备份的方式进行灾难恢复来节省成本。 如果故障时间每小时的成本可能很高,那么应在服务的高可用性和灾难恢复方面做出更多投资。需要在服务预配、可用性要求和组织对风险的响应三个方面进行权衡。

根据应用程序的可用性和生命周期,和服务的特性,选择相应的实例可以很大程度上提高云产品的使用率和管理成本,例如:

  1. 实例的选型:了解实例规格的关键特点,选择更合适的ECS实例类型可以提高资源利用率,节约成本您需要结合性能、价格、工作负载等因素,做出性价比与稳定性最优的决策。根据业务场景和vCPU、内存、网络性能、存储吞吐等配置划分,阿里云云服务器ECS提供了多种实例规格族。可以先使用低配置资源, 观察评估运行资源负载后升级配置,或将使用率低的资源降低配置或释放。

  1. 计费模式的选择:根据业务特性选择合适的计费方式是成本优化最直接的方式,从付费层面来看,按照业务场景长期使用的稳定业务资源需求通过选择成本较低的节省计划方式来支撑负载,明确业务使用周期的业务且有状态的资源需求可以通过成本相对较高但使用时长选择更灵活的按量付费方式,如临时测试、弹性伸缩选择按量付费资源。按量付费资源开启停机不收费以保留数据并能快速启用。 如需长期运行,转预付费计费模式。无状态且可容错的业务可以通过成本非常低廉的抢占式实例来支撑。间歇性计算需求,和事件驱动的计算需求也可以使用阿里云函数计算产品。比如监听存储中的数据文件发生变化触发一次性的计算任务等,您无需采购与管理服务器等基础设施,函数计算为您准备好计算资源,弹性地、可靠地运行任务,并提供日志查询、性能监控和报警等功能。

  1. 良好的设计弹性架构:在做架构设计时要根据应用的生命周期制定可以弹性伸缩的架构,在业务高峰期通过计算资源的弹性机制增加部署节点,在业务低峰期缩减云资源,能极大提升资源利用率和成本利用最大化。

4. 通过调研业务部门未来一段时间的业务规划,梳理并列出适合业务并留有一定冗余量的资源规格和用量。

技术团队管理

让技术人员和合作伙伴更好的学习和使用阿里云,让技术人员掌握最新的云管理技能。也可以考虑选择阿里云的企业工单服务,企业支持计划,专家服务和阿里云大学的学习资源。

  1. 工单服务 提供7*24小时的在线支持服务,专家在线解答技术人员的问题。

  2. 企业支持计划 在基础售后支持以外,业务系统复杂的客户或对服务有更高要求的客户, 还可选择阿里云提供的多种企业支持计划,获取工单极速响应、专属技术保障通道、技术服务经理等专属支持。

  3. 企业增值服务 提供全周期的专业服务,满足企业各类场景的服务需求,包含上云前的方案咨询,上云中的迁移部署,以及上云后的运维管理与优化提升。

  4. 面向客户的专业培训解决方案 面向行业企业数字化转型需求及高校应用型复合人才培养需求,提供专业的合作方案及培训体系。企业培训依托阿里云的行业数字化实践和云计算、大数据、人工智能、云原生等前沿领域科技探索,沉淀专业的人才培养体系和服务,以行业数字化培训赋能,以阿里生态商业链接,突破发展转型的短板与瓶颈,助力企业实现跨越式发展。

自动化和标准化

通过标准化流程和工具定义云资源开通和部署的过程, 包括账号管理,云资源管理,访问设置、事件响应和灾难恢复。 标准化的流程和工具可以帮助您节约用云成本,但是实施标准化过程可能会发现需要额外的开发成本。

比如,使用云命令行和Terraform来定义IT基础设施:

  • 自动化管理基础结构Terraform能够创建配置文件的模板,以可重复、可预测的方式定义、预配和配置ECS资源,减少因人为因素导致的部署和管理错误。能够通过使用部署同一模板,创建相同的开发、测试和生产环境。

  • 基础架构即代码(Infrastructure as Code)可以用代码来管理维护资源。允许保存基础设施状态,从而使您能够跟踪对系统(基础设施即代码)中不同组件所做的更改,并与其他人共享这些配置。

  • 降低开发成本, 您通过按需快速的创建开发和部署环境来降低成本,并且具有可移植性。

也可以使用可视化应用资源创建工具云速搭CADT快速生成云上架构,云速搭提供丰富的预制应用架构模板,同时也支持自助拖拽方式定义应用云上架构,显著地降低应用云上管理的难度和时间成本。

成本优化目标

在企业和组织发展的不同的阶段,企业成本核算部门会对用云提出不同的成本要求,比如,每年的企业用云成本约束,云资源使用量明显增长, 但是云资源的费用较慢增长(与资源用量非线性)。这不光是对于云厂商通过自身技术迭代增加算力减少成本的要求,同时也是对企业自身IT系统技术演进的要求。成本优化的目标,也可以是在保持存量业务不变的情况下,减少10%的云资源使用。这些成本管理和优化的目标需求需要被识别,并在计划阶段进行管理,并在后续的执行阶段得以实施。

在规划阶段,企业需要关注云计算相关技术最新发展趋势,利用好技术红利带来的成本优化。伴随云计算的发展,新技术、新产品、新工具会不断出现, 往往都会带来性能或效率上的提升,从而提升企业用云性价比和管理效率。如服务器、数据库的升级、研发效能平台的推出等,企业利用新技术架构或产品类型适配自身业务发展可提升用云效能。

最佳实践

从实践的角度,我们给出以下需求分析的建议:

  1. 为了与业务目标保持一致,企业的相关干系人必须定义需求。

    • 好的实践:企业需要从自身内部定义IT需求,做好需求收集和跟踪管理的顶层设计,并对需求实施的结果进行反馈,进而找到完备的,长期有效的需求收集活动和路径。

    • 不好的实践:完全依赖供应商和放任供应商定义和资源企业云资源,而不给供应商相应的指导和约束,这样会导致后续云治理的工作异常的复杂。

  1. 企业在IT实施过程中要收集安全需求并加以实施。

    • 好的实践:在对业务需求进行规划的时候,对业务的安全需求和企业的安全需求进行分析

    • 不好的实践:对安全需求视而不见,或者在IT系统部署完成时才部署安全产品,没有第一时间将安全成本加以管理。在安全产品部署之前,导致业务安全受损和稳定性受损可能会给企业带来更大的损失。

  1. 企业按照服务等级创建高可用性和灾难恢复策略。

  2. 企业有必要对自动化和标准化进行投入,但也要考量实际情况和业务需求,避免过度实施。