专属解决方案
对于每个企业,FinOps的落地方案应该因人而异。阿里云结合阿里集团内部实践经验、外部客户支持经验,沉淀了一些方法论与工具,本文节选部分进行介绍。
FinOps的背景与实践意义
什么是FinOps
技术领域的进步往往来自于打破原先的边界,例如DevOps是Development和Operations的综合体,FinOps即是Finance和DevOps综合体。它强调让云上每一分花费都产生价值。
当下企业为什么要实践FinOps呢?
一是云计算的发展带来了巨大的技术红利,带来了灵活性的同时也引入了复杂性。云的账单理解成本非常高,云计算资源中的众多共享资源也存在巨大的分摊难题。
二是云计算弹性收费、随开随用的模式,使得成本管控难度大大增加,容易超支。财务同学不理解技术语言,技术同学不关注财务语言,两者不在一个信息水平面上,造成了沟通障碍,无法为共同的成本目标努力。
三是与云计算有关的财务过程缺乏数字化管理技术,在预算、预测和费用控制方面都遇到了难题,大部分情况下是一笔糊涂账。
那么实践了FinOps对企业又有什么收益呢?
首先,最直接的收益当然是云成本能够看得清楚,分得合理,用得明白,云成本能够得到有效管控。
但这不是最重要的,更重要的收益在于在业财一体的视角下,让企业具备精细化云计算管理的能力、技术和流程,增强企业的组织力。
业财一体的大视角,是真正将云计算的能力消化吸收到企业的组织中去的。在这个过程中,精益管理的能力既是手段也是目的。纵观过去100年企业史,没有任何一家卓越的公司仅仅是因为成本优化而达到辉煌和延续的,与之相伴的精益管理能力才是其安身立命之本。新的技术要素总是层出不穷,只有建立能驾驭新技术要素的能力,企业才能不断跟上时代的浪潮。而FinOps的修炼就是驾驭云计算这个时代最大技术生产力的最佳实践。
FinOps的基础设施建设-要降本先提效
大部分企业在实践FinOps的时候,往往一开始就聚焦降本,但这反而往往治标不治本。众所周知的是,每家企业年年都有技术降本的目标,但能真正管控住成本的企业却少之又少。绝大部分的降本优化动作,沦为了一时的项目和运动。组织管理的复杂性在这一次次的运动中被人为堆高了,这是影响效率的最大因素。
如果云没有和企业的财务管理、采购管理、技术管理等流程、制度深度融合对接,云的技术价值则只能囿于和IDC自建成本的apple-to-apple的对比中,这其实是暴殄天物。
一般企业在用云、管云时经常面临的具象化的挑战是云的账号与权限体系、账单、分摊与结算、成本结构等与企业的财务系统、人员组织架构、采购系统、运维体系、业务技术体系等之间适配,而且很多时候要引起后者的改造。这是X*Y个问题的集合。鉴于此,我们梳理出一套基于“五大统一”的FinOps基础设施治理方案,在具体执行降本之前,让工具、平台、流程、制度、文化先行,然后两者交替前行,互相迭代至最优。只有这样才能形成可累积的成本优化和效率提升的能力,从而能以科学精神和工程能力让云计算为企业提供持久的前进动力。
统一账号与权限
对账号进行分类分级,和企业的组织相匹配;
对存量的账号进行治理,清理僵尸账号,统一各存量账号的付款、发票、归属部门、权限等;
不允许随意开设新账号,新账号的开通与申请需要有流程制度来保证;
账号的角色属性要有区分,禁止吃大锅饭,角色与权限粒度力求精细;
账号的管理要有一个工具或平台来承接,通过良好的体验让企业整体都能用起来。
统一账单
在多云、混合云等环境下,建立通用的标准云账单模型,统一其中的计量计费标准,统一账单字段。车同轨,书同文,形成企业内部各部门、各团队、各职能角色乃至于不同云供应商之间的共同语言。
统一库存与采购
在云的随需随用和传统分批次采购的模式之间取得一种最适合企业的模型。由于绝大部分企业都有IT历史资产和区别于某朵云的技术栈,所以很多情况下,云并没有办法做到满足企业业务需求的极致弹性,需要一定的库存水位来确保业务稳定。此外,绝大部分的企业业务并不需要那么高的弹性,其业务稳定,业务波峰波谷较平缓而且可预测,这时候企业更重视通过统一采购来拿到更好的商务折扣以及云的经济适用。
统一预算
无预算不开支,有预算不超支,非必须不列支。没有预算,云的成本管理就是个自嗨的面子工程。但云上的预算怎么做,在超支和新列支的情况下应该怎么做管理决策并进一步形成顺畅的管理流程?可以说,是不是做好了云的预算管理制度,是衡量一家企业用云能力是否达到及格线的标志。
统一成本管理
重点解决如何进行成本洞察,发现成本问题,基于成本问题形成可迭代的、不断正循环的成本管理制度。
成本问题的发现与成本管控最佳实践
总的来说,云的成本管控主要围绕用量、用法和计费三大要素来展开。
但在此之前,首先要能够发现成本问题,所以首先要做的就是成本维度对云资源的监控与巡检。在此基础上,将成本问题提炼出来,变成风险治理项推送给相关账号owner。账号的owner会根据成熟的成本优化方案,按照上述的逻辑从用法、用量和计费三个层面人力介入进行优化实操。事后则会有成本优化治理结果的验证以及相应的成本管理月报呈现出来。做到成本的可观测、可操作、可追踪。
上述“任务过程处理”部分,需要凭借一套事先就有一定积累厚度的各云产品成本优化方案,如下:
而在这些原始方案的基础上,企业结合自己的技术现状,不断去更新和优化。此时再佐以合适的激励制度,可以形成企业成本精细化管理的正反馈循环。
基于预算与预测的可持续成本治理
没有预算的成本管理是技术的独舞,无论多么优雅,却缺少了最重要的观众。预测只有与合适的预算管控流程相结合才有意义。而预实分析则是在事前、事中和事后预算和实际发生对比分析的基础上增加了预测视角。
此外,将云的预算管理纳入进来之后,企业的全面预算才算是补齐了最后一块短板,全面预算才有了切实的管理意义。从我们的实践来看,数字化云上预算管理的意义在于:
将各BU的年度预算额度关联存量资源利用率进行考核,并结合技术优化指标,持续提高存量资源利用率,最大化资源效能;
为经营责任制下面向云的业财一体能力打好了基础,通过统一数字化平台,同时满足财务、业务、运维、研发的不同分析需求;
预算不再依赖于人的判断,基于系统人员自运营,来关注云上成本消费,通过数据和算法更准确反映历史情况并提供预测未来的决策参考,从而算清楚企业每笔云上交易花费的成本;
通过“预算-资源-人-实体组织-成本治理”的数字化联动模式,升级企业组织架构,让业务及时感知成本变化;
结合成本和营收,将精细化管理下获取的盈利在财年底释放红利返回给业务BU。
云资源由于其复杂性和弹性,以及企业非技术人员对其理解深度尚浅等因素,在做预算时往往无从下手。下图是相对较好落地的一种预算相关各方协作方案:
在上述原则和约束条件下,需要建立一个预算管理的系统/平台。这个平台旨提高预算管理的效率,并能有效约束云成本的泛滥。关于平台建设,阿里云可以提供可落地的方案咨询服务。
此外,如前所述,预测能力也是这个环节中必不可少的一部分。预测能力主要用在成本异常的检测和提前发现上,次要地用于下个周期的成本数量上。同样在算法和算法工程以及如何应用到实际的成本管理中,阿里云提供具体的技术方案与咨询服务。
成本优化飞轮
如之前“成本问题发现与管控”环节所述,在成本优化原始方案的基础上,企业需要结合自己的技术现状,不断去更新和优化。而这个成本优化的飞轮之形成,是需要一定的技术方案和管理方案保障的。
首先是,成本优化的结果需要量化体现出来,在此基础上,各员工的工作价值需要可统计和量化。可以借鉴的做法是使用“资源健康分”的制度或类似的概念。
有了“健康分”这样的制度,人、数据、流程就可以有机流动起来。如果数据不流动,所谓的正反馈循环(即飞轮)就是空中楼阁。
仅有健康分制度还是不够的,还需要在企业内部建立与之相应的企业文化,提高全员的精细化管理的意识。对于一家大型企业来说,考核在前,文化在后。能用制度解决的事情就不要上升到文化,否则整体终究流于乡愿。因此,我们建议从以下两者入手,来逐步建立切实可行的成本精细化管理的意识:
将健康分与个人的物质激励、绩效考核联动起来;
公司内部发起战役或项目,将部门利益与成本优化联动起来;
周期性地在企业内部做成本优化的方案宣讲,不仅让大家知道why,更让大家知道how。
上述几个方面,阿里云可以提供有真实实践经验的可落地咨询方案。
效能提升飞轮
成本优化不是目的,而是手段,最终目的是修炼企业内功,提升云资源的效能,也通过云资源效能驱动组织经营效率的提升。FinOps要求企业用云的视角来审视管理和业务,而不仅仅将云当成一种和传统服务器、存储、网络、数据库等类似的资源。
那么企业如何借助FinOps来驱动公司组织经营效率的提升,并进而建成这个飞轮呢?首先需要定义清楚在云的视角何谓高效的经营效率。我们认为,能够充分驾驭云计算这个先进生产力的企业,其组织结构和管理模式是和云计算高度相似的,因为相似,所以适配。所以从以下三个方面来定义高效率的组织:
弹性
企业中的团队、部门、项目、产品等逻辑单位,能够像云资源一样具备高弹性和按需伸缩、按量支付成本的特质。这会赋予企业以巨大的灵活性和快速适应市场的能力,提高企业的生存能力。这就要求企业的上述逻辑单元和云资源能够同频。
规模经济
对于云计算厂商以及对于使用云计算的企业,随着规模的扩大,其边际成本逻辑上越来越低。而企业则往往未必如此,随着企业规模扩大,其边际成本会上升到盈亏平衡点。企业生产三要素中,劳动者不具备规模效应。劳动对象的边际成本往往是递增的(比如用户的获取越来越难)。而劳动工具部分,包含企业业务中用到的所有生产力软硬件和生产关系软硬件,则需要尽可能地具备规模效应。换言之,能够用IaaS、PaaS、SaaS的就尽可能用。
数据回流
众多XaaS成功的一个很大原因在于,产品相关的数据是可以低成本、快速地回流给厂商的。例如用户使用产品的行为数据,产品的故障和bug数据,产品的市场数据等。这也是互联网带给企业服务市场的一个利好。作为一家使用云计算的企业,除了前面所述劳动工具的数字化之外,需要尽可能劳动者和劳动对象数字化,并尽量让与自己业务相关的数据能够回流回来。一家企业各生产要素数字化程度越深、这些数据能够在企业与市场之间循环的比例越重,则这家企业的经营效率就越高。从这点来说,企业需要将其组织、流程、工具等尽可能和云捆绑,搭上云计算与生俱来的数据洪流的顺风车。FinOps中强调的所谓成本可观测、成本维度的监控数据,也不过是数据汪洋中的沧海一粟罢了。
基于以上洞察,我们提炼出用云管云的众多最佳实践和技术方案,帮助企业更好的驾驭云、驾驭数据,FinOps不过是一个起点。按照上述逻辑,我们需要将企业的业财能力、数字化采购能力、研发效能、人力资源、Devops等等领域重新按照云的逻辑刷新一遍。而在这几个领域,阿里集团既有自己亲身经历的最佳实践,也有经过思考沉淀的方法论与工具。
具体请加入钉钉群4175022543获取专家咨询服务。