如何使用注册集群的成本洞察功能

本文介绍如何查看集群成本洞察及集群成本洞察的能力。

前提条件

开启成本洞察功能

开启成本洞察

步骤一:为成本洞察组件配置RAM权限

通过onectl配置

  1. 在本地安装配置onectl。具体操作,请参见通过onectl管理注册集群

  2. 执行以下命令,为成本洞察组件配置RAM权限。

    onectl ram-user grant --addon ack-cost-exporter

    预期输出:

    Ram policy ack-one-registered-cluster-policy-ack-cost-exporter granted to ram user ack-one-user-ce313528c3 successfully.

通过控制台配置

  1. 创建RAM用户。具体操作,请参见创建RAM用户

  2. 创建自定义权限策略。具体操作,请参见创建自定义权限策略ack-cost-exporter组件所需的权限策略内容如下。

    展开查看ack-cost-exporter组件所需的自定义权限策略

    {
        "Version": "1",
        "Statement": [
            {
                "Action": [
                    "bssapi:QueryInstanceBill",
                    "bssapi:DescribeInstanceBill"
                ],
                "Resource": "*",
                "Effect": "Allow"
            },
            {
                "Action": [
                    "ecs:DescribeDisks",
                    "ecs:DescribeSpotPriceHistory",
                    "ecs:DescribeInstances",
                    "ecs:DescribePrice"
                ],
                "Resource": "*",
                "Effect": "Allow"
            },
            {
                "Action": "eci: DescribeContainerGroupPrice",
                "Resource": "*",
                "Effect": "Allow"
            }
        ]
    }
  3. RAM用户添加权限。具体操作,请参见RAM用户授权

  4. RAM用户创建AccessKey。具体操作,请参见创建AccessKey

  5. 使用AccessKey在注册集群中创建名为alibaba-addon-secretSecret资源。执行以下命令,创建ack-cost-exporter组件使用的Secret。

    kubectl -n kube-system create secret generic alibaba-addon-secret --from-literal='access-key-id=<your AccessKey ID>' --from-literal='access-key-secret=<your AccessKey Secret>'

步骤二:安装ack-cost-exporter组件

通过onectl安装

执行以下命令,安装ack-cost-exporter组件。

onectl addon install ack-cost-exporter

预期输出:

Addon ack-cost-exporter, version **** installed.

通过控制台安装

  1. 登录容器服务管理控制台,在左侧导航栏选择集群列表

  2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择应用 > Helm

    Helm页面存在ack-cost-exporter安装记录,请删除对应的安装记录后,再按照后续操作重新接入。

  3. 在集群管理页左侧导航栏,选择运维管理 > 组件管理

  4. 组件管理页面,单击日志与监控页签,找到ack-cost-exporter组件,单击右下角的安装。然后单击确定

跨账号开启成本洞察

在使用账号AACK注册集群纳管账号B下的ACK集群时,需要在账号BACK集群中授权成本洞察功能,以便该功能可以访问账号B的账单数据。

步骤一:为账号B配置RAM权限并安装组件

  1. 登录容器服务管理控制台,在左侧导航栏选择集群列表

  2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择成本套件 > 成本洞察

  3. 授予访问ACK集群账单数据的权限。

    • 如果您使用的是托管版集群,系统会自动授予相关权限。完成授权后,系统会创建AliyunCSManagedCostRole角色,阿里云Prometheus使用该角色访问您在费用与成本的账单数据并进行成本洞察。

      您也单击云资源访问授权链接,在云资源访问授权页面,单击同意授权

    • 如果您使用的是专有版集群,请展开按照以下步骤完成授权。

      1. 成本洞察页面,单击KubernetesWorkerRole-***

      2. RAM角色页面的权限管理页签,单击权限策略列下的k8sWorkerRole****

      3. 在权限策略详情页面的策略内容页签下,单击修改策略内容

      4. 在脚本编辑框中Statement字段中增加以下授权规则,修改完成后单击编辑基本信息,然后单击确定

                {
                    "Action": [
                        "bssapi:QueryInstanceBill",
                        "bssapi:DescribeInstanceBill"
                    ],
                    "Resource": "*",
                    "Effect": "Allow"
                },
                {
                    "Action": [
                        "ecs:DescribeDisks",
                        "ecs:DescribeSpotPriceHistory",
                        "ecs:DescribeInstances",
                        "ecs:DescribePrice"
                    ],
                    "Resource": "*",
                    "Effect": "Allow"
                },
                {
                    "Action": [
                        "eci: DescribeContainerGroupPrice"
                    ],
                    "Resource": "*",
                    "Effect": "Allow"
                }
        说明

        多个策略内容需要用英文半角逗号(,)分隔。

    说明

    账号Back集群无需安装Prometheus,若您已安装,请先卸载ack-arms-prometheus组件。具体操作,请参见管理组件

步骤二:为账号A安装组件

  1. 在注册集群所在账号A中安装Prometheus。具体操作,请参见将阿里云Prometheus接入注册集群

  2. 在注册集群所在的账号A中,配置ack-cost-exporter组件参数AckRegisteredClusterId为账号BACK集群的clusterId

    1. 登录容器服务管理控制台,在左侧导航栏选择集群列表

    2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择应用 > Helm

      Helm页面存在ack-cost-exporter安装记录,请删除对应的安装记录后,再按照后续操作重新接入。

    3. 在集群管理页左侧导航栏,选择运维管理 > 组件管理

    4. 组件管理页面,单击日志与监控页签,找到ack-cost-exporter组件,单击右下角的安装

    5. 安装组件 ack-cost-exporter页面中,配置registeredAckClusterId为账号B中集群的clusterId,然后单击确定

注意事项

  • 在开启成本洞察功能后第二天08: 00自动显示账单数据。

  • 选择右上角下拉菜单,可查看不同时间范围的集群成本可视化大盘数据。

集群维度成本分析

筛选维度

image.png

功能

序号

描述

集群成本统计选项

集群成本统计指标选项,包含优惠后实际账单成本和原价账单成本统计:

  • 优惠后实际账单成本:大盘默认选项。成本统计时,统计集群中所有云资源的应付金额。

  • 原价账单成本统计:成本统计时,统计集群中所有云资源的官网价。

关于应付金额和官网价的详细介绍,请参见明细账单

说明

集群中应用部分成本统计只会按原价账单成本进行统计,包括Namespace、Pod等应用维度成本统计。

成本分摊模型选项

成本分摊模型选项,包含单资源模型和权重混合资源模型,具体分为如下几类。

  • CPU模型:大盘默认选项。使用CPU资源请求量估算Pod成本。

  • 内存模型:使用内存资源请求量估算Pod成本。

  • CPU-内存混合模型(推荐权重):对CPU指标和内存指标加权估算Pod成本,使用系统推荐权重。

  • CPU-内存混合模型(自定义权重):对CPU指标和内存指标加权估算Pod成本。使用此分摊模型,您需要先选择分摊模型为CPU-内存混合模型(自定义权重),再编辑CPU权重设置

关于成本分摊模型选择的详细介绍,请参见成本估算策略介绍

时间范围

选择大盘时间范围,默认为最近7天。您可以设置该项查看不同时间范围的成本、资源趋势。

集群成本概览

image

功能

序号

描述

查看成本分摊模型

这里的展示的数据结果与您选择的成本分摊模型选项有关。大盘默认CPU模型选项,使用CPU资源请求量估算Pod成本。

通过昨日、本周、本月花费统计对集群成本概要分析

成本费用统计,其中昨日集群花费、花费日环比、本周累计花费和本月累计花费为本集群的云资源的账单成本统计。

本周累计、本月累计花费分别为自然周、自然月的账单花费统计。由于账单出账周期存在T+1延迟,周一将不显示本周累计花费数据,每月第一日也将不显示本月累计花费的统计值。

花费日环比为昨日集群成本与前一天之间的环比:

  • 当相对昨日费用的变化比率的字体颜色为绿色时,表示相比前一日成本有所降低。

  • 当相对昨日费用的变化比率的字体颜色为红色时,表示相比前一日成本有所增长。

通过成本趋势判断集群成本、资源浪费概要情况

集群花费和集群容量趋势图,黄色曲线表示成本消费,蓝色曲线表示实际的集群容量。通常情况下,两条曲线会存在一定的相关性。

对比两者相关性,如果发现两者呈现趋势不一致,表明集群的单位核成本异常。请检查是否有资源花费过高。

以命名空间维度查看实时成本估算和费用分摊

④⑤

④为集群内各命名空间的实时估算成本,命名空间成本是其中所有Pod估算成本之和,⑤为各命名空间的费用分摊值,是命名空间按估算比例对集群实际费用的分摊。

说明
  • 命名空间的成本统计按原价账单成本计算。

  • 命名空间下的Pod若未配置Resource Request (CPU),则视为未申明集群资源需求量,不参与命名空间成本统计计算。

在一个集群中,可能存在各种不同规格、不同付费方式的节点类型。当您通过命名空间进行分账时,不能仅通过每个命名空间的资源申请值进行判断,还需要考虑命名空间下Pod所在节点的情况。

成本洞察将每个节点的实时费用进行了转换。在统计命名空间维度的费用时,转换为:

Σ(Pod资源申请/节点容量)*节点单位价格

这种方式可以精确估算命名空间的成本费用。用户折扣、代金券抵扣、包年包月等各种延迟计费策略可能会导致命名空间的成本费用和集群的实际账单费用不一致。但您可以通过命名空间的成本占比乘以集群总费用的方式获得命名空间级别的分账。

稳定性&效率分析

image

功能

序号

描述

查看集群总资源用量

展示集群中各种QoSPod数量以及总资源用量。

查看集群Pod资源使用率

提供集群所有Pod的基础信息和资源使用率(Usage/Request),同时支持过滤和排序。您可以通过该功能批量查看集群中资源水位最高或最低的工作负载。

查看集群Burstable Pod的资源配置情况

查看QoS类为Burstable Pod的资源配置情况,同时支持过滤和排序。您可以通过该功能查看每个Burstable PodCPU、内存等资源的请求(Request)和限制(Limit)情况,便于您了解Pod所消耗的集群资源并识别潜在的资源瓶颈。

查看集群中BestEffort Pod的资源使用量

查看QoS类为BestEffort Pod的资源配置情况,这类Pod一般具有较高稳定性风险,您可以通过过滤和排序列表,来检查是否有预期外的BestEffort Pod,以便及时处理来规避风险。

关于稳定性&效率分析功能的更多信息,请参见使用成本洞察识别集群资源风险

集群费用分析

image

功能

序号

描述

通过云产品费用趋势与比例分析云产品成本

①②

③为集群中各云产品的成本花费占比统计,④为集群中各云产品的成本花费趋势统计。

一个集群中会包含多种云产品,不同云产品的使用方式、计费模型不同,会导致云产品产生的费用存在差异。您可以通过成本趋势和组合查看不同的云产品消费情况,从而进行成本决策。

通过集群总成本趋势分析集群成本

每日集群的总费用成本趋势统计。

通过节点池成本费用趋势分析集群成本

集群中各节点池或虚拟节点(Virtual Node)的节点账单成本分析。

以命名空间维度查看实时成本估算趋势

在一个集群中,可能存在各种不同规格、不同付费方式的节点类型。当您通过命名空间进行分账时,不能仅通过每个命名空间的资源申请值进行判断,还需要考虑命名空间下Pod所在节点的情况。

成本洞察将每个节点的实时费用进行了转换。在统计命名空间维度的费用时,转换为:

Σ(Pod资源申请/节点容量)*节点单位价格

这种方式可以精确估算命名空间的成本费用。用户折扣、代金券抵扣、包年包月等各种延迟计费策略可能会导致命名空间的成本费用和集群的实际账单费用不一致。但您可以通过命名空间的成本占比乘以集群总费用的方式获得命名空间级别的分账。

集群的计算资源请求、使用率趋势

使用场景:

  • 用于分析集群中的水位、容量是否存在资源浪费的情况。

  • 当出现弹性等场景时,集群水位会产生周期性波动,此图表可供您规划资源容量。

趋势图含义:

  • Y轴:整体集群的计算资源总容量(Capacity),代表整体集群能承载的应用资源数。

  • 绿色柱状图:当前小时集群中所有被分配(Request)的计算资源需求数。

  • 黄色柱状图:当前小时集群中真实Pod容器中进程使用的计算资源(Usage),即应用真实使用资源。

应用已分配且未使用资源=绿色柱状图-黄色柱状图

集群剩余资源可分配量=Y轴-绿色柱状图

分析流程:

  • 未分配资源浪费:您可以参考集群剩余资源可分配量,使用集群中未被分配使用的浪费资源。通过调整集群中Pod的资源需求量(Request),或适当降配。推荐保持剩余资源可分配量为总集群资源的20%左右。

  • 已分配未使用资源浪费:您可以参考集群已分配未使用部分资源量,配合命名空间大盘中浪费应用、Pod的排名,找到分配资源量过大但实际使用资源量较小的应用,对资源分配量(Request)进行降配。

  • 弹性扩缩场景:业务呈现周期波动等常见场景下,可参考柱状图的波动水位进行资源容量规划,并配置合适的弹性策略。

集群计费详细信息

⑦⑧

云产品维度、云产品实例维度的集群每日账单列表。

使用成本洞察分析云下IDC节点及应用的成本

成本洞察支持注册集群中IDC节点以及节点上应用的成本洞察分析能力。成本洞察默认以0.2元/Core*Hour的单价计算注册集群中IDC节点以及节点上应用的成本。您可以通过以下方式配置自定义IDC节点的单价。

  • 为所有IDC节点配置统一的价格

    kube-system命名空间下,通过为ack-cost-exporterDeployment中配置env环境变量参数DefaultIDCPricePerCPUCoreHour,配置所有IDC节点的统一价格。

    说明

    此处价格为每单位CPU核时(元/Core*Hour)的价格。

    env:
    # 配置每台IDC节点每单位CPU核时价格为0.3元。
    - name: DefaultIDCPricePerCPUCoreHour
      value: "0.3"
  • 为某个节点配置单独的价格

    在对应节点Node中增加label"node.kubernetes.io/price-per-day”,为该节点单独配置节点价格。

    说明

    此处价格为此节点一天的总价。

    执行以下命令,为某个节点配置定义每天该节点总价为100元。

    kubectl label nodes <node-name> node.kubernetes.io/price-per-day="100"

常见问题

为什么开启成本可视化后没有数据显示?

  • 检查RAM角色授权操作已完成。具体操作,请参见开启成本分析功能的步骤3。 成本分析需要集群的监控数据和费用数据,监控数据在开启后3min内即可开始采集,费用相关的数据需要从集群开启成本分析后的第二天08: 00才有数据显示。

  • 检查集群是否配置NAT网关。由于部分地域不支持通过内网endpoint查询账单,请确认您的集群具备访问公网能力。

  • 花费日环比明日预测花费需要连续采集两天的费用数据后才显示。

为什么命名空间的费用相加与实际的费用账单不相等?

命名空间的费用是通过成本估算来进行核算的,并非直接通过账单分析得出。因此,在做费用估算的时候,是通过目录价进行计算的,当集群的花费包含代金券、折扣、节约计划等抵扣策略的时候,会出现一定的数据偏差。但是,可以通过命名空间的比例乘以集群的总费用进行费用的分账。

为什么有些节点上的Pod数据无法获取成本数据?

检查RAM角色授权操作已完成,并确认授权策略中包含"ecs:DescribeDisks"权限。具体操作,请参见开启成本分析功能的步骤3

为什么账单中展示的云产品没有包括集群使用的所有云产品?

成本分析只统计本集群独享的云产品,对于多集群共享的云产品,不在成本分析的账单统计范围内。

成本洞察功能依赖费用与成本控制台的费用标签功能,即依赖于云产品标签中的特定标识(key:value=ack.aliyun.com:{{集群ClusterId}})来实现集群成本的追踪与统计。如果您在费用标签页面关闭了此标签,那么集群级别的成本统计将会失效。为了解决成本统计失效问题,您需要重新在费用标签管理页面启用ack.aliyun.comack.alibabacloud.com/nodepool-id标签。

为什么本月/本周累计花费比实际低

集群从成本洞察组件成功开通后才开始统计产生的费用,不会统计组件开通前的数据。