随着生成式AI和实时数据分析需求的激增,开发者迫切需要兼顾高性能、低成本且免运维的检索服务。阿里云Elasticsearch Serverless检索增强型应用(8.17版)基于官方Elasticsearch 8.17版本,深度融合了无服务器架构与分层扩展能力,以满足信息检索、向量搜索、语义分析等通用场景的需求,并提供全托管服务。本文为您介绍检索增强型应用(8.17版)的最新特性、费用说明、服务开通及应用创建等内容。
商业化说明
检索增强型应用(8.17版)将于北京时间2025年6月27日18:00起进行商业化收费。届时,使用该服务将按照相关计费项收取相应费用。
若您无需再使用该服务,请于商业化收费前关闭服务,以免产生费用。如有任何问题,请提交工单或通过用户钉钉交流群(群号为72335013004)联系技术支持人员处理。
最新特性
检索增强型应用(8.17版)在新特性支持、弹性性能优化及成本效率方面均有显著提升。相比此前的检索通用型(7.10版),新版本提供了更强大的功能和更灵活的使用体验:
新特性支持:检索增强型应用(8.17 版)针对向量检索场景进行了全面优化,新增对稀疏向量和稠密向量的支持等功能,具体参考附录一:支持的开源API。
弹性性能:新版架构经过全面升级,在应用配额范围内,弹性资源调度更加灵活,请求响应速度显著提升,为您提供更高效的性能体验。
成本优化:相比7.10版本的按量付费模式,8.17版本引入了预留固定配额+按需弹性调用的计费方式。通过灵活组合两种模式,您可以更高效地利用资源,从而有效降低整体使用成本。
费用说明
检索增强型应用(8.17版)将根据预留固定CU配额、按需使用的弹性CU以及存储空间消耗费用进行收费。计费详情请参见计费说明。
CU选配参考
目前已开放2 CU、4 CU、6 CU、8 CU等规格,您需要根据CU用量上限评估选型。
检索增强型应用(8.17版)底层采用读写分离架构,在资源分配时将默认按照1:1的配比分配查询、写入CU资源。开启弹性计算功能后,查询CU上限与写入CU上限均为固定CU配额的1.5倍。不同的固定CU配额将影响应用的用量上限,上限关系如下表,您可结合实际用量调整配额。
CU的上限的单位为CU/s。
规格 | 弹性计算功能 | 弹性CU上限 | 应用CU总上限 | 查询CU上限 | 写入CU上限 |
固定CU配额=X CU | 开启 | 2X | 3X | 1.5X | 1.5X |
固定CU配额=Y CU | 关闭 | 0 | Y | 0.5Y | 0.5Y |
创建检索增强型应用(8.17版)
当您首次创建ES Serverless任意应用时,系统会自动为您开通该服务,服务开通即代表您已悉知并同意相关服务协议。应用创建成功后,将按照相应计费标准进行收费,若未创建成功,则不会产生任何费用。
创建应用。
进入Serverless应用创建页面,选择创建实例的地域。
在应用管理页面,单击创建应用。
配置应用的基本信息。
输入应用名称,选择应用类型为检索增强型,其他参数保持默认或自定义。
配置应用的访问信息。
本文示例网络访问方式配置为公网访问,在公网访问白名单中添加本地设备的IP地址,以便使用本地设备访问Serverless应用的Kibana。配置应用的网络访问,请参见配置Serverless应用公网或私网访问。
输入用户密码,后续登录Kibana时需要使用。
单击立即创建。
您可在应用管理页面查看已创建的应用列表。等待应用状态变为运行中,表示应用已创建成功。随后,您可根据个人需求,尝试体验更多功能。
开放的API
检索增强型应用(8.17版)支持的API详情,请参见附录一:支持的开源API。
支持的集群及索引配置
检索增强型应用(8.17版)支持的集群及索引配置详情,请参见附录二:支持的集群及索引配置。
支持的插件
检索增强型应用(8.17版)支持的插件详情,请参见附录三:支持的插件。
监控中心
详细的配置监控告警服务以及指标解释,请参见监控指标与告警配置。