您可以通过ACK成本洞察功能查看集群、命名空间、节点池和应用等成本可视化大盘。本文介绍如何查看集群洞察分析及成本可视化大盘。

前提条件

查看集群成本洞察分析

  1. 登录容器服务管理控制台,在左侧导航栏选择集群
  2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择运维管理 > 成本分析
  3. 在右侧成本洞察页面,单击集群维度页签,查看集群的成本可视化大盘。
    说明
    • 在开启成本洞察功能后第二天08: 00自动显示账单数据。
    • 选择右上角下拉菜单,可查看不同时间范围的集群成本可视化大盘数据。
    成本洞察大盘

集群成本分析能力

成本洞察页面,单击集群维度页签,查看集群的成本可视化大盘。

集群成本大盘
功能序号描述
集群成本统计选项集群成本统计指标选项,包含优惠后实际账单成本和原价账单成本统计:
  • 优惠后实际账单成本:大盘默认选项。成本统计时,统计集群中所有云资源的应付金额。
  • 原价账单成本统计:成本统计时,统计集群中所有云资源的官网价。
关于应付金额和官网价的详细介绍,请参见明细账单
说明 集群中应用部分成本统计只会按原价账单成本进行统计,包括Namespace、Pod等应用维度成本统计。
时间范围选择大盘时间范围,默认为最近7天。您可以设置该项查看不同时间范围的成本、资源趋势。
通过昨日、本周、本月花费统计对集群成本概要分析。成本费用统计,其中昨日集群花费、花费日环比、本周累计花费和本月累计花费为本集群的云资源的账单成本统计。

本周累计、本月累计花费分别为自然周、自然月的账单花费统计,由于账单出账周期为T+1,周一将没有本周累计花费数据,每月第一日也将没有本月累计花费的统计值。

花费日环比为昨日集群成本与前一天之间的环比:
  • 当相对昨日费用的变化比率的字体颜色为绿色时,表示相比前一日的成本是降低的。
  • 当相对昨日费用的变化比率的字体颜色为红色时,表示相比前一日的成本是增长的。
通过成本趋势判断集群成本、资源浪费概要情况集群花费和集群容量趋势图,黄色曲线表示成本消费,蓝色曲线表示实际的集群容量。通常情况下,两条曲线会存在一定的相关性。

当对比两者相关性后,如果发现两者呈现不一致的趋势,表示集群的单位核成本异常,需要检查是否使用了更贵的资源。

成本分摊
功能序号描述
通过命名空间进行部门成本分账⑤⑨⑤为集群中各命名空间需求资源的成本分布图。其中idle部分为集群中未被分配资源的成本占比,⑨为集群中各命名空间的需求资源的成本分布趋势图。
说明
  • 命名空间的成本统计按原价账单成本计算。
  • 命名空间下的Pod若未配置resource request (CPU),则未申明集群资源需求量,不参与命名空间成本统计计算。

在一个集群中,可能存在各种不同的规格、付费方式的节点类型,当您通过命名空间进行分账时,不能仅通过每个命名空间的资源申请值进行判断,同时需要考虑命名空间下Pod所在节点情况。

成本洞察将每个节点的实时费用进行了转换。在统计命名空间维度的费用时,转换为:

Σ(Pod资源申请/节点容量)*节点单位价格

这种方式可以精确的估算出命名空间的成本费用,不过由于用户折扣、代金券抵扣、包年包月等各种延迟计费策略,可能会导致命名空间的成本费用和集群的实际账单费用不一致。但是,可以通过命名空间的成本占比乘以集群总费用的方式获得命名空间级别的分账。

通过集群总成本趋势分析集群成本每日集群的总费用成本趋势统计。
通过云产品费用趋势与比例分析云产品成本⑥⑧⑥为集群中各云产品的成本花费占比统计,⑧为集群中各云产品的成本花费趋势统计。

在集群中会包含多种不同的云产品,不同的使用方式、计费模型会导致云产品的费用上存在比较多的差异。可以通过成本趋势和组合看到不同的云产品消费,从而进行成本决策。

通过节点池成本费用趋势分析集群成本集群中各节点池、或虚拟节点(virsual-kubernetes)的节点账单成本分析。
集群计算资源
功能序号描述
集群的计算资源请求、使用率趋势使用场景:
  • 用于分析集群中的水位、容量是否存在资源浪费的情况。
  • 当出现弹性等场景时,集群水位会周期性波动,可从此图参考进行资源容量规划。

趋势图含义:

  • Y轴:图中100%表示整体集群的计算资源总容量(Capacity),代表整体集群能承载的应用资源数。
  • 绿色柱状图:当前小时集群中所有被分配(Request)的计算资源需求数。
  • 黄色柱状图:当前小时集群中真实Pod容器中进程使用的计算资源(Usage),即应用真实使用资源。

应用已分配且未使用资源=绿色柱状图-黄色柱状图

集群剩余资源可分配量=Y轴-绿色柱状图

分析流程:

  1. 未分配资源浪费:您可以参考集群剩余资源可分配量,对集群中未被分配使用的浪费资源进行利用。通过调整集群中Pod的资源需求量(Request),或进行适当降配。推荐保持剩余资源可分配量为总集群资源的20%左右。
  2. 已分配未使用资源浪费:您可以参考集群已分配未使用部分资源量,配合命名空间大盘中浪费应用、Pod的排名,找到分配资源量过大,但实际使用资源量较小的应用,对资源分配量(Request)进行降配。
  3. 弹性扩缩场景:业务呈现周期波动等常见场景,参考柱状图的波动水位可进行资源容量规划,以及配置合适的弹性策略。
集群每日账单列表云产品维度、云产品实例维度的集群每日账单列表。

命名空间成本分析能力

成本洞察页面,单击命名空间维度页签,查看命名空间的成本可视化大盘。命名空间大盘能够通过命名空间筛选、展示各命名空间的资源和成本信息。命名空间常对应于公司的部门或团队。

命名空间
功能序号描述
命名空间选择分析的集群命名空间,默认为ALL,即整个集群。
命名空间下应用的资源统计您可以通过CPU、内存指标判断命名空间资源浪费情况。指标含义如下:
  • CPU Request:当前该命名空间已被分配的CPU核数。
  • CPU Usage:真实消耗的CPU核数。
  • Memory Request:当前该命名空间已被分配的内存。
  • Memory Usage:真实消耗的内存。
③⑥③为命名空间下应用的成本统计,⑥为命名空间下应用成本趋势统计。

总花费成本为选择的Namespace在该时间范围内按原价账单成本统计的成本花费。

该命名空间花费占集群总花费百分比,展示选中的命名空间占总集群成本的花费比例。

Pod所在的节点的CPU每核每小时的单价趋势统计。

资源分配情况和真实消耗情况的趋势,蓝色曲线表示已分配的资源,红色曲线表示真实消耗的资源。

在Pod调度时,节点会为Pod预分配一定的资源,但容器进程真实消耗的资源通常与预分配的不一致,⑤图能够反应出二者间的关系,从而进行资源浪费的优化。

资源请求量
功能序号描述
Pod资源请求量排行统计分析集群中Pod资源请求量大的应用,用于容量规划等场景。
Pod资源使用率排行查看资源利用率低的Pod应用副本,帮助发现浪费应用。
Pod资源闲置排行资源闲置率(Pod未被使用的计算资源占已分配资源的比重)为Pod未被使用的资源占已分配资源的比重,能够反映Pod的资源浪费情况。

通过分析命名空间中资源浪费最多的Pod,您可以直观找到造成命名空间资源浪费的主要应用,从而分析浪费原因,针对性地设计资源优化策略。

节点池成本分析能力

节点池大盘提供了集群资源维度的成本洞察,能够为您提供节点池资源使用分析和付费策略的选择。

节点池侧重资源的维度,站在不同节点池的视角进行资源成本的规划与治理。例如GPU节点池这类资源可能分属多个部门,难以通过命名空间维度分析成本,而通过节点池可以直接从资源维度设置策略,进行成本优化。

成本洞察页面,单击节点池维度页签,查看节点池的成本可视化大盘。

节点池
功能序号描述
按节点池分析部署的应用的成本、资源情况选择节点池和账单统计指标,分析不同节点池上部署的应用。
通过成本趋势判断节点池浪费情况节点池成本费用。
  • 当相对昨日费用的变化比率的字体颜色为绿色时,表示相比前一日的成本是降低的。
  • 当相对昨日费用的变化比率的字体颜色为红色时,表示相比前一日的成本是增涨的。
一段时间内节点池中节点每核时的单价费用变化的趋势。
节点池中节点的花费成本变化趋势,以及该节点池节点占总集群费用比例的变化趋势。
不同费用节点
功能序号描述
通过付费策略预测成本节省空间,协助您优化资源组合和付费策略。⑤⑦一段时间内不同付费售卖策略节点实例数的占比分析和变化趋势,以及节点池节点不同售卖策略节点的费用占比分析和变化趋势。支持如下付费售卖策略:
  • PayAsYouGo:按量付费。
  • PayByPeriod:包年包月。
  • Spot:抢占式实例。
⑥⑨更换节点付费策略成本节省预测分析,分析当前集群该节点池中所有节点全部更换为不同付费售卖策略后,可以节省或会带来的超额成本,协助您优化资源组合和付费策略。
节点池中所有节点费用与付费策略的统计。

应用成本分析能力

应用大盘以Label通配符匹配的方式,能够筛选出您关心的应用进行成本、资源的统计,侧重于场景化的成本优化,典型场景包括大数据业务、AI业务、弹性业务。

通过Label通配符匹配的方式,您不仅可以监控单应用的成本和资源用量,还可以对多个有相关性的应用进行监控。例如大数据工作流的场景,可以为流程中的所有应用加上一致性的Label,从而对整个工作流业务进行成本分析。

成本洞察页面,单击应用维度页签,查看应用的成本可视化大盘。

应用维度
功能序号描述
查看应用视角的成本分析支持按命名空间、按Pod标签对筛选的方式查看一组应用Pod的成本、资源使用情况。
通过应用维度判断业务成本使用情况实时查看应用的成本,对资源利用率进行分析。指标说明如下:
  • 应用花费:当前所选应用在大盘所查询时间范围的花费成本,按原价账单成本统计。
  • 应用当前副本数:统计分析该应用峰谷值的Pod副本数。
  • 计算资源利用率:CPU和内存的利用率(Usage / Request)。
  • 所在节点每小时成本:应用所在的每个节点每核时的单位价格。
  • 应用运行时间:应用的运行时间统计。
  • 总消耗的核时资源数:应用总消耗的核时资源数。
  • 应用占整个集群/命名空间的资源利用率:该应用资源在集群、命名空间中的资源占比。
一段时间内应用每小时费用成本、单位核时价格的变化的趋势,应用的Pod规模副本数趋势统计,以及应用的Pod规模副本数趋势统计。

CPU和Memorey请求和使用趋势图含义:

  • Y轴:整体集群的计算资源总容量(Capacity),代表整体集群能承载的应用资源数。
  • 蓝色柱状图:当前小时集群中所有被分配(Request)的计算资源需求数。
  • 黄色柱状图:当前小时集群中真实Pod容器中进程使用的计算资源(Usage),即应用真实使用资源。

应用已分配且未使用资源=蓝色色柱状图-黄色柱状图

集群剩余资源可分配量=Y轴-蓝色柱状图

分析浪费流程:

  1. 未分配资源浪费:您可以参考集群剩余资源可分配量,对集群中未被分配使用的浪费资源进行利用。通过调整集群中Pod的资源需求量(Request),或进行适当降配。推荐保持剩余资源可分配量为总集群资源的20%左右。
  2. 已分配未使用资源浪费:您可以参考集群已分配未使用部分资源量,配合命名空间大盘中浪费应用、Pod的排名,找到分配资源量过大,但实际使用资源量较小的应用,对资源分配量(Request)进行降配。
  3. 弹性扩缩场景:在业务呈现周期波动等常见场景中,可以参考柱状图的波动水位可进行资源容量规划,以及配置合适的弹性策略。
应用维度2
功能序号描述
更换节点付费策略成本节省预测分析分析当前应用中所有节点全部更换为不同付费售卖策略后,可节省或会带来的超额成本,协助您优化资源组合和付费策略。
查看应用视角的成本分析包含应用所在节点付费策略统计,应用所在节点的每小时成本和付费策略统计,用于分析应用中所在节点的不同付费策略分布与趋势。
应用各Pod的资源、成本分析详情查看应用中包含的各Pod的资源、成本分析详情。成本按原价账单成本进行估算,按Pod的所需资源(Request)进行计算。
应用各Pod的资源、成本闲置排名通过成本费用分析部门成本消耗情况,协助您找出闲置率高的浪费应用,指标说明如下:
  • Pod资源请求量排名:统计分析集群中Pod资源请求量大的应用,适用于容量规划等场景。
  • Pod资源使用率排名:查看资源利用率低的Pod应用副本,帮助发现浪费应用。
  • Pod资源闲置排行:为Pod未被使用的资源占已分配资源的比重,能够反映Pod的资源浪费情况。

    通过命名空间中资源浪费最多的Pod,您可以直观看出造成命名空间资源浪费的主要应用,从而分析浪费原因,有针对性地设计资源优化策略。

常见问题

为什么开启成本可视化后没有数据显示?检查RAM角色授权操作已完成。具体操作,请参见开启成本分析功能的步骤3。 成本分析需要集群的监控数据和费用数据,监控数据在开启后3min内即可开始采集,费用相关的数据需要从集群开启成本分析后的第二天08: 00才有数据显示。

为什么命名空间的费用相加与实际的费用账单不相等?命名空间的费用是通过成本估算来进行核算的,并非直接通过账单分析得出。因此,在做费用估算的时候,是通过目录价进行计算的,当集群的花费包含代金券、折扣、节约计划等抵扣策略的时候,会出现一定的数据偏差。但是,可以通过命名空间的比例乘以集群的总费用进行费用的分账。

为什么有些节点上的Pod数据无法获取成本数据? 检查RAM角色授权操作已完成,并确认授权策略中包含"ecs:DescribeDisks"权限。具体操作,请参见开启成本分析功能的步骤3

为什么账单中展示的云产品没有包括集群使用的所有云产品?成本分析只统计本集群独享的云产品,对于多集群共享的云产品,不在成本分析的账单统计范围内。成本洞察功能依赖阿里云用户中心标签统计功能,依赖云产品key:ack.aliyun.com value:{{集群ClusterId}}标。当在阿里云用户中心费用标签页面关闭此标签,将会导致集群成本统计失效。此时您需要在阿里云用户中心费用标签页面开启ack.aliyun.com标签的分析统计功能。