监控预警
成本监控和预警有助于发现成本问题和成本优化机会点,因此企业应该通过各种监控工具对成本数据和资源数据进行有效监控,并通过预警的方式通知到相关的运维人员或财务人员,从而对发现的问题或优化机会进行跟踪处理,避免预期外费用、优化资源使用率,实现成本节约。
管理预算并预警
对云上成本进行预算管理是管控云上成本的有效手段,通过预算编制、预警和预测、滚动调整预算、预实分析和优化,建立起基于预算的成本闭环管理链路。
企业可以使用预算管理工具进行事前的云上成本规划与预算编制、事中预算监控与预警通知、事后的预实对比分析。比如企业可以:
基于财务单元、产品、账号等多种维度对成本进行多维度预算管理。
基于费用预算、使用率与覆盖率预算、按量编制预算,对云资源产生的消费金额或者抵扣资源的使用率/覆盖率情况进行预算跟踪。
使用支持12个月的费用预测工具,为预算编制提供预测建议。
对实际费用和预测费用分别进行预警。
通过设置多条预警,根据不同阈值多次预警。
通过预实对比分析,及时发现预实差异产生的原因。
开启异常检测预警
因预期外的消费导致的费用超支是常见的成本失控情况,应该定期检查消费项目是否都是基于实际业务需求。企业可以使用阿里云提供的异常检测功能,及时地发现成本异常,并通过配套提供的根因参考信息,更快速地定位到问题发生原因,从而解决问题。
异常检测通过人工智能算法实现,企业可以自定义异常检测的灵敏程度,系统智能识别费用波动异常,从而实现自动监控、发现和预警预期外异常费用。
监控可用额度并预警
可用额度即用户账户的可用金额,账户余额里会扣减掉被冻结或未来扣除的部分。如果是信控用户,则信控的可用额度也会计算在可用额度内。建议企业开启可用额度预警及时获取可用额度的信息。
监控高额消费并预警
企业应该监控高额消费,并及时分析超额原因,使用高额消费预警工具对后付费产品日账单超过预警阈值时(统计范围为截止昨日24时的日账单费用),进行预警。
监控资源包使用额度
企业应该对抵扣资源设置额度预警。系统将根据用户设置的额度预警提示用户,以免发生抵扣资源不足的情况。自然月周期型和动态月周期型资源包和总量递减型资源包,报警的规则如下分别为:
自然月周期型和动态月周期型资源包依据每周期保有总量,每周期按阈值提醒1次,每周期在用尽时提醒1次。总量递减型资源包,存续周期内按阈值提醒1次;
监控资源水位
对云资源的资源使用率监控可以掌握云资源的消耗水位,对云资源水位过载,资源水位偏低,资源闲置等情况进行及时跟踪,可以帮助企业更好的管理云资源的使用。在监控的基础上,企业可分析以往数据,有效预测云平台容量未来变化,提前预警。
日常云资源使用监控
需要日常建立对云资源水位的监控,云上用户可以使用云监控 CMS(Cloud Monitor)的云产品监控的能力,实时或者准实时观测云资源的使用情况,同时也可以设置报警规则。
云资源高负载运行通常意味着可能需对云资源进行弹性扩容。企业需要对资源高负载运行的情况进行数据分析,看是否存在资源使用不当的情况,需要进行架构优化或者代码优化如果资源消耗是正常的,则可以根据成本计划阶段制定的计划和标准进行新增资源的审批,财务批准后进行资源扩容。
云资源低负载运行通常意味着低负载资源或者闲置资源,会造成资源的浪费,可以分析之后进行资源的缩容,缩容的操作应避免对业务产生影响,并在业务低峰期进行。
设置了计算资源弹性伸缩等规则的资源变更时间也要进行监控,避免因为规则设置不当导致的过度扩容或者没有及时的缩容,增加额外的成本。
对于闲置的,长时间没有使用的计算资源要进行资源关停和释放,对于不需要的存储文件,如快照等也可以及时删除,避免资源的持续浪费。
根据持续一段时间周期的监控数据,评估可优化的资源使用空间,通过监控数据,可以观测到存在忙时及闲时流量特性的场景,可指导企业采用灵活组合多种计费方式资源以节省成本。
使用企业级云监控应对复杂的部署和使用场景
企业借助资源目录轻松实现企业跨阿里云账号资源的统一监控。对于混合云场景,建议使用企业级云监控立足云上,高效、低成本解决云下资源的监控数据的汇聚,快速构建云上云下一体化监控体系。使用智能水位分析报告工具可以使企业轻松获取基于阿里云大数据的性能报告,采用人工智能算法深度分析产品使用状态。
结合预算计划监控数据和资源监控数据进行相关性分析
预算监控数据可以帮助我们观测资金的消耗,并关联到相关的云产品的具体使用情况,结合云资源的监控数据可以分析出资源消耗发生的时间点,事件,并采取相关的措施。设置预算计划之后,需要跟踪计划周期内云资源开通和使用情况,云资源开通数量或者资源消耗低于预算计划有可能是系统上线不及预期,或者项目停滞等多种原因,需要根据实际情况变更预算计划。