Serverless应用编排管理-Knative-容器服务 Kubernetes 版 ACK-阿里云

Knative是一款基于Kubernetes的Serverless框架，支持基于请求的自动弹性、在没有流量时将实例数量自动缩容至零、版本管理与灰度发布等能力。在完全兼容社区Knative和Kubernetes API的基础上，ACK Knative进行了多维度的能力增强，例如通过保留实例降低冷启动时间、基于AHPA实现弹性预测等。

为什么要在Kubernetes集群中使用Knative

Knative介绍

Knative是一款基于Kubernetes集群的Serverless框架，提供云原生、跨平台的Serverless编排标准。Knative通过整合容器构建、工作负载管理以及事件模型来实现这一Serverless标准。优势如下。

更聚焦于业务逻辑：Knative通过简单的应用配置、自动扩缩容等手段让开发者聚焦于业务逻辑，降低运维负担、减少对底层资源的关注。
标准化：将业务代码部署到Serverless平台时，需要考虑源码的编译、部署和事件的管理。目前社区和云厂商提供的Serverless解决方案和FaaS方案标准不一。Knative提供了一个标准、通用的Serverless框架。
例如，如需在Knative中实现事件驱动，您可以编写对应的YAML文件（CR）并在集群中部署，无需与云产品做深度绑定，便于跨平台迁移。
使用门槛低：Knative支持将代码自动打包为容器镜像并发布为服务，也支持将函数快捷地部署到Kubernetes集群中，以容器的方式运行。
自动弹性及版本管理：Knative支持在没有流量时自动将实例数量缩容至零，从而节省资源，还提供版本管理、灰度发布等功能。
事件驱动：Knative提供了完整的事件模型，便于接入外部系统的事件，并将事件路由到适当的服务或函数进行处理。

关于Knative应用模型（Knative Service）的介绍，请参见Knative应用模型介绍。

核心组件

Knative包括以下核心组件，分别执行不同的功能。

Knative Serving：管理Serverless工作负载，提供了应用部署、多版本管理、基于请求的自动弹性、灰度发布等能力，而且在没有业务流量时可以将应用实例缩容至零。
Knative Eventing：提供了事件源的接入、事件注册和订阅、以及事件过滤等一整套事件管理的能力。事件模型可以有效地解耦生产者和消费者的依赖关系。
Knative Functions: 提供了一个简单的方式来创建、构建和部署Knative服务。您无需深入了解底层技术栈（例如Kubernetes、容器、Knative），通过使用Knative Functions，即可将无状态、事件驱动的函数作为Knative服务部署到Kubernetes集群中。

为什么要使用ACK Knative

在完全兼容社区Knative并提供标准Kubernetes API接口的基础上，ACK Knative进一步增强产品化能力并提供了更丰富的产品方案。

产品化能力：提供了产品化一键部署能力，您无需购买资源搭建系统。同时提供产品控制台，支持白屏化操作，降低Kubernetes集群和Knative的使用门槛。
简化运维：
- 核心组件托管：在ACK集群中，Knative的核心组件Knative Serving和Knative Eventing均由ACK创建和托管，无需您承担资源费用，且提供高可用保障。
- 网关托管：ACK Knative提供ALB、ASM和Kourier网关。除社区兼容的Kourier外，其余云产品网关的Controller均由ACK创建，提供全托管、免运维的网关服务。
生态集成：无缝集成了阿里云的计算（ECI、ECS、ACS）、可观测（日志服务SLS、Prometheus）、CI/CD（云效）、应用集成（EventBridge）等产品，无需自行采购服务器，也无需自建服务，便能在Knative服务中实现日志与监控告警、持续交付、事件驱动等能力。
更丰富的功能特性：在社区Knative的基础上，ACK Knative结合实际业务场景提供了开箱即用的、更为丰富的产品方案。例如以下方案。
- 保留实例：为延迟敏感应用保留一个低成本常驻实例，缓解社区Knative“缩容至0”策略带来的冷启动延迟，以提升服务响应速度，有效控制资源成本。
- Knative自动伸缩：提供开箱即用的基于请求的自动弹性 KPA（Knative Pod Autoscaler），同时也支持HPA，您还可以为Knative服务配置AHPA（Advanced Horizontal Pod Autoscaler）弹性能力。如果您的应用所需资源具备周期性变化，推荐您使用AHPA进行弹性预测，提前预热所需的资源，缓解使用Knative时遇到的冷启动问题。

关于ACK Knative和社区Knative对比的更多信息，请参见阿里云Knative和开源Knative对比。

使用场景

ACK Knative的典型使用场景如下。

业务场景	说明
Web服务的托管	简化部署：ACK Knative封装了许多Kubernetes的底层细节，通过Knative服务大大简化了工作负载的部署和管理。简化多版本管理：Revision机制能够确保每个修订版本都有唯一标识，便于管理不同的版本，例如版本的回滚。简化流量灰度发布：ACK Knative提供流量管理功能。通过为不同Revision版本的服务分配不同的流量比例，可以快速实现灰度发布、A/B测试等。
Serverless应用	聚焦业务逻辑：开发者无需关心IaaS资源，只需关注业务逻辑的开发，应用配置也大大简化，降低底层基础设施的运维成本。资源按需使用、自动弹性：ACK Knative可以根据流量请求和并发情况自动扩缩资源，当没有业务流量时还可以将实例数量缩减至零，节省资源和成本。
AI场景	聚焦业务逻辑：GPU等异构计算场景下，开发者无需关心底层基础设施的维护，只需关注AI任务的构建和部署。资源按需使用、自动弹性：ACK Knative可以根据实际负载情况自动扩缩资源，针对负载具有波动性的推理服务能够有效降低资源使用成本。可移植性：ACK Knative可以运行在任何兼容Kubernetes的环境中，Knative服务可以在云上、本地数据中心甚至是边缘设备上移植部署。
事件驱动场景	Knative Eventing提供了完整的事件模型，简化了接入外部系统的事件的流程。例如，IoT设备可以将传感器数据发送到Knative服务中，ACK Knative可以配置对应的事件源用于接收数据，并触发相应的处理逻辑，例如数据存储、实时分析、监控告警等。

使用流程

ACK Knative的使用流程如下图所示。

流程	说明
适用范围	1.22及以上版本的ACK托管集群。如需升级，请参见手动升级集群。
	已部署ACK Knative，安装Knative Serving组件，请参见部署与管理Knative组件。
	已完成网关选型并部署网，请参见为Knative选择网关。 ALB：基于阿里云ALB提供了更为强大的Ingress流量管理方式，全托管免运维，且支持自动弹性能力。 ASM：统一管理微服务应用流量、兼容Istio的托管式平台。通过流量控制、网格观测以及服务间通信安全等功能，简化您的服务治理，并为运行在异构计算基础设施上的服务提供统一的管理能力。 Kourier：基于Envoy架构实现的一款Knative社区开源的轻量级网关。
服务部署与管理	指定使用的资源类型：默认使用ECS资源运行Knative服务。使用ECI提供的Pod资源应对突发流量，请参见使用ECI资源。使用ACS提供的Pod资源应对突发流量，请参见使用ACS资源。在AI推理服务等场景下使用GPU资源，请参见使用GPU资源。集群中同时存在ECS和ECI资源时，可基于ResourcePolicy来声明资源的扩容和缩容顺序，请参见在Knative中同时使用ECS和ECI资源。与抢占式实例结合使用，降低云计算资源，请参见使用抢占式实例。配置保留实例，保留一个低规格的突发性能实例，平衡好使用成本和启动时长，请参见配置保留实例。
	自动伸缩：基于流量请求数（QPS）实现服务的自动扩缩容KPA（Knative Pod Autoscaler），请参见基于流量请求数实现服务自动扩缩容。配置AHPA（Advanced Horizontal Pod Autoscaler），既可以根据历史指标弹性预测未来负载的情况并提前准备扩缩容，又能够结合Cron表达式实现定时扩缩，请参见基于AHPA实现定时自动扩缩容。配置基于CPU指标阈值的HPA，请参见在Knative中使用HPA。
	版本管理与灰度发布：基于Revision修订版本实现版本的管理，例如版本的回滚，请参见创建修订版本。基于Revision版本，根据流量百分比灰度发布服务，请参见基于流量灰度发布服务。
	Knative服务的访问： Knative服务的默认域名格式为`{route}.{namespace}.{default-example.com}`，其中`{default-example.com}`是默认的域名后缀，您可以自定义域名后缀，请参见使用自定义域名和Path。使用自定义域名时，推荐为自定义域名配置一个HTTPS证书，提高数据传输的安全性，请参见配置HTTPS证书访问。配置探针（Liveness Probe和Readiness Probe），监测和管理服务的健康状况和可用性，请参见在Knative中配置端口探测。
进阶功能	事件驱动：Knative Eventing提供完整、系统的Serverless事件驱动模式，包括外部事件源的接入、事件流转和订阅、以及对事件的过滤等功能。请参见Knative事件驱动。
	Knative Functions：简化在Kubernetes集群中创建、部署和调用函数的流程，请参见部署Knative Functions。
	AI推理服务：基于机器学习模型服务框架KServe将经过训练的模型（例如TFServing、TorchServe、Triton等）部署到模型服务运行时，请参见基于KServe快速部署一个推理服务。基于Fluid加速模型推理服务Pod的启动，请参见基于Fluid加速Pod启动。 ACK还提供了在Knative中部署AI模型推理服务的最佳实践，例如如何在Knative中部署一个vLLM推理服务、如何加速模型部署、如何配置GPU共享调度等，请参见基于Knative部署vLLM推理应用、在Knative中部署AI模型推理服务的最佳实践。
	服务网格：在Knative服务中集成服务网格ASM，以实现复杂的流量管理并增强服务安全性。
可观测性与成本管理	日志采集：基于SLS无侵入式地完成日志数据采集、消费、投递以及查询分析等功能，请参见在Knative上实现日志采集。
	监控大盘：把Knative接入阿里云Prometheus监控，查看Knative的响应延迟、请求并发数等数据，请参见查看Knative服务监控大盘。
	监控告警：使用SLS创建日志告警监控规则，请参见为Knative服务开启监控告警。
	成本洞察：作为企业IT成本管理人员，可以为Knative服务启用成本洞察功能，了解Knative服务的资源使用量及成本分布，请参见启用Knative服务成本洞察。

客户案例

典型客户	客户案例	相关实践
	数禾科技以大数据和技术为驱动，为金融机构提供高效的智能零售金融解决方案。为了解决支撑模型计算的底层应用资源无法灵活且快速地根据请求量调整算力等问题，数禾科技采用ACK + Knative的方式来部署模型服务，实现了根据请求的扩缩容能力、允许Pod缩容到0以及多版本管理的能力。	数禾科技 AI 模型服务基于阿里云容器服务实现 Serverless 容器化
	灵伴科技（Rokid）是一家专注于人机交互技术的产品平台公司，基于ACK Knative方案部署了其在线服务系统，实现了多版本管理以加快应用迭代、基于请求的自动扩缩容以精准调配GPU资源等能力，实现了运维、成本和性能之间的平衡。	灵伴科技（Rokid）借助 Knative 实现 AI 应用云原生 Serverless 化
	合思致力于财务数智化服务的应用与创新。随着公司业务的扩展，合思面临着大量涌现的新服务和急剧上升的集群运维成本。为此，合思采用了基于Knative的流量策略实现灰度发布并优化了微服务管理流程，提升业务的响应速度和系统稳定性的同时降低了运维成本。	拥抱 Knative，合思加速 Serverless 化演进实践
	XTransfer是一站式外贸企业跨境金融和风控服务公司，基于ACK Knative方案搭建了DevOps平台，实现了算法模型的Serverless部署。在DevOps平台上，算法工程师可以创建待上线模型版本、定义推理脚本、指定模型服务所需资源（最小副本数、所需的GPU资源、所需的内存资源等），并最终完成模型的发布。	云原生 Knative 组件助力 XTransfer 加速应用云原生 Serverless 化
	深圳硅基仿生科技股份有限公司是一家创新医疗器械研发与产业化公司，采用ACK Knative方案加速了深度学习模型的性能提升，同时降低了服务部署成本。	硅基仿生业务全面 Serverless 容器化的增效降本之旅