集群成本分析与优化-容器服务ACK

更新时间:

操作说明

登录“费用与成本控制台”,进入“成本管理-成本优化”页后,点击“集群成本分析与优化-容器服务ACK”即可进入云原生场景下的集群成本分析与优化分析页。

说明

首次进入时,出现开通页,您可以确认功能对应的使用场景说明,点击“立即开通”即可免费开通该功能。

image

进入优化页后,可在下拉框中选择您的集群:

image

完成后,默认在下方各tab页中查看相应集群的成本分析情况。

集群成本概览

image

集群成本可视化大盘的相关功能介绍如下表:

功能

序号

描述

通过成本趋势判断集群浪费情况

成本的费用,Daily Cost为昨日费用,Weekly Cost为上周费用,Monthly Cost为上月费用,Day-on-day Ratio为相对昨日费用的变化比率。

  • 当相对昨日费用的变化比率的字体颜色为绿色时,表示相比前一日的成本是降低的。

  • 当相对昨日费用的变化比率的字体颜色为红色时,表示相比前一日的成本是增涨的。

黄色曲线表示成本消费,蓝色曲线表示实际的集群容量。通常情况下,两条曲线会存在一定的相关性。

当对两者进行相关性对比后发现两者呈现不一致的趋势,表示集群的单位核成本异常,需要检查是否使用了更贵的资源。

一段时间内的成本变化趋势。

通过命名空间进行部门成本分账

在一个集群中,可能存在各种不同的规格、付费方式的节点类型,当您通过命名空间进行分账时,不能够仅通过每个命名空间的资源申请值进行判断,同时需要考虑命名空间下Pod所在节点情况。

成本分析将每个节点的实时费用进行了转换,在统计命名空间维度的费用时,可转换为:

Σ(Pod资源申请/节点容量)*节点单位价格

这种方式可以精确的估算出命名空间的成本费用,不过由于用户折扣、代金券抵扣、包年包月等各种延迟计费策略,可能会导致命名空间的成本费用和集群的实际账单费用不一致。但是,可以通过命名空间的成本占比乘以集群总费用的方式获得命名空间级别的分账。

通过云产品费用趋势与比例分析云产品成本

在集群中会包含多种不同的云产品,不同的使用方式、计费模型会导致云产品的费用上存在比较多的差异。可以通过成本趋势和组合看到不同的云产品消费,从而进行成本决策。

集群应用浪费分析

在“集群应用浪费分析”页中,能够通过命名空间筛选、展示各命名空间的资源和成本信息。命名空间常对应于公司的部门或团队。

命名空间

功能

序号

描述

通过CPU、内存指标判断命名空间资源浪费情况

  • CPU Request为当前该命名空间已被分配的CPU核数,CPU Usage为真实消耗的CPU核数,Actual CPU Utilization为实际的CPU使用率。

  • Memory Request为当前该命名空间已被分配的内存,CPU Usage为真实消耗的内存,Actual CPU Utilization为实际的内存利用率。

  • 资源分配情况和真实消耗情况的趋势,蓝色曲线表示已分配的资源,红色曲线表示真实消耗的资源。

  • 在Pod调度时,节点会为Pod预分配一定的资源,但容器进程真实消耗的资源通常与预分配的不一致,该图能够反映出二者间的关系,从而进行资源浪费的优化。

一段时间内资源利用率的变化趋势。

  • CPUUtilization为Pod的CPU使用率,MemoryUtilization为Pod的内存利用率,它们是Pod的真实消耗资源占已分配资源的比重。WasteRate为Pod未被使用的资源占已分配资源的比重,能够反映Pod的资源浪费情况。

  • 通过命名空间中资源浪费最多的Pod,您可以直观看出造成命名空间资源浪费的主要应用,从而分析浪费原因,有针对性地进行资源优化策略的设计。

通过成本费用分析部门成本消耗情况

  • Cost为该命名空间产生的费用,Cost Radio为该命名空间费用占集群总费用的比例,Pod Cost Per Core为Pod每核时的单位价格。

  • 由于用户折扣、代金券抵扣、包年包月等延迟计费策略,命名空间的成本费用和集群的实际账单费用可能不一致,通过命名空间的成本占比,乘以集群实际产生的账单费用,能够实现命名空间级别的分账。

集群节点池成本分析

节点池大盘提供了集群资源维度的成本洞察,能够为您提供节点池资源使用分析和付费策略的选择。节点池侧重资源的维度,站在不同节点池的视角进行资源成本的规划与治理。例如GPU节点池这类资源可能分属多个部门,难以通过命名空间维度分析成本,而通过节点池可以直接从资源维度设置策略,进行成本优化。

image

功能

序号

描述

通过成本趋势判断节点池浪费情况

成本的费用,Daily Cost为昨日费用,Day-on-day Ratio为相对昨日费用的变化比率,Cost Radio为该节点池费用占集群总费用的比例,Pod Cost Per Core为Pod每核时的单位价格。

  • 当相对昨日费用的变化比率的字体颜色为绿色时,表示相比前一日的成本是降低的。

  • 当相对昨日费用的变化比率的字体颜色为红色时,表示相比前一日的成本是增涨的。

一段时间内费用变化的趋势。

一段时间内节点池费用占比的趋势。

通过付费策略预测成本节省空间

节点池中节点的付费策略统计情况。

此时节点池中所有节点的付费策略为PayAsYouGo按量付费,PayByPeriod Saving Forecasting为预测当前节点池所有节点全部切换为包年包月时每小时节省的成本和比例,Spot Saving Forecasting为预测当前节点池所有节点全部切换为抢占式实例时每小时节省的成本和比例。

ChargeType Cost Forecasting为节点池中所有节点在选择不同付费策略时的费用,结合各付费策略对成本节省的预测,可以协助您对资源组合和付费策略进行优化。

集群应用成本分析

应用大盘以Label通配符匹配的方式,能够筛选出您关心的应用进行成本、资源的统计,侧重于场景化的成本优化,典型场景包括大数据业务、AI业务、弹性业务。

通过Label通配符匹配的方式,您不仅可以监控单应用的成本和资源用量,还可以对多个有相关性的应用进行监控。例如大数据工作流的场景,可以为流程中的所有应用加上一致性的Label,从而对整个工作流业务进行成本分析。

image

功能

序号

描述

通过应用维度判断业务成本使用情况

Cost为应用费用,Pod Num包括该应用峰、谷值的副本数,Utilization为CPU和内存的利用率,Cost Per Core*Hour为每核时的单位价格,Uptime是应用的运行时间,Core*Hour是应用总消耗的核时资源数,Utilization Statistic是应用占整个集群/命名空间的资源利用率。

一段时间内应用费用变化的趋势。

一段时间内应用Pod规模的趋势。

一段时间内应用单位核时价格的趋势。

通过Pod维度分析业务成本

Utilization为Pod的CPU和内存的利用率,Cost Per Core*Hour为Pod每核时的单位价格,Cost Evaluation为Pod的费用,Core*Hours是Pod总消耗的核时资源数,Uptime是Pod的运行时间。

常见问题

问题一:为什么开启成本可视化后没有数据显示?

回答:检查RAM角色授权操作已完成。具体操作,参考开启成本分析功能的步骤5。 成本分析需要集群的监控数据和费用数据,监控数据在开启后3 min内即可开始采集,费用相关的数据需要从集群开启成本分析后的第二天08: 00才有数据显示。

问题二:为什么命名空间的费用相加与实际的费用账单不相等?

回答:命名空间的费用是通过成本估算来进行核算的,并非直接通过账单分析得出。因此,在做费用估算的时候,是通过目录价进行计算的,当集群的花费包含代金券、折扣、节约计划等抵扣策略的时候,会出现一定的数据偏差。但是,可以通过命名空间的比例乘以集群的总费用进行费用的分账。

问题三:为什么有些节点上的Pod数据无法获取成本数据?

回答:检查RAM角色授权操作已完成,并确认授权策略中包含"ecs:DescribeDisks"权限。具体操作,参考开启成本分析功能的步骤5。

问题四:为什么账单中展示的云产品没有包括集群使用的所有云产品?

回答:成本分析只统计本集群独享的云产品,对于多集群共享的云产品,不在成本分析的账单统计范围内。