检索增强型应用(8.17版,公测中)
随着生成式AI和实时数据分析需求的激增,开发者迫切需要兼顾高性能、低成本且免运维的检索服务。阿里云Elasticsearch Serverless检索增强型应用(8.17版)基于官方Elasticsearch 8.17版本,深度融合了无服务器架构与分层扩展能力,以满足信息检索、向量搜索、语义分析等通用场景的需求,并提供全托管服务。本文为您介绍公测说明、最新特性、开放的API以及如何创建服务等内容。
商业化说明
检索增强型应用(8.17版)将在以下地域开始进行商业化收费:
华东2(上海)、华北2(北京)地域:自北京时间2025年6月20日18:00起,使用该服务将按照相关计费项收取费用。
华南1(深圳)、华东1(杭州)地域:自北京时间2025年6月27日18:00起,使用该服务将按照相关计费项收取费用。
若您无需再使用该服务,请于商业化收费前关闭服务,以免产生费用。如有任何问题,请提交工单或通过用户钉钉交流群(群号为72335013004)联系技术支持人员处理。
最新特性
检索增强型应用(8.17版)在新特性支持、弹性性能优化及成本效率方面均有显著提升。相比此前的检索通用型(7.10版),新版本提供了更强大的功能和更灵活的使用体验:
新特性支持:检索增强型应用(8.17 版)针对向量检索场景进行了全面优化,新增对稀疏向量和稠密向量的支持等功能,具体参考附录一:支持的开源API。
弹性性能:新版架构经过全面升级,在应用配额范围内,弹性资源调度更加灵活,请求响应速度显著提升,为您提供更高效的性能体验。
成本优化:相比7.10版本的按量付费模式,8.17版本引入了预留固定配额+按需弹性调用的计费方式。通过灵活组合两种模式,您可以更高效地利用资源,从而有效降低整体使用成本。
费用说明
公测期间将不产生任何费用。服务商业化后检索增强型(8.17版)将根据预留固定CU配额、按需使用的弹性CU以及存储空间消耗费用进行收费。预留固定CU具有更低的单价,弹性CU按需调度,单价相对较高,目前定价方案可参考如下表格,最终价格请以商业化发布时期为准。
计费项 | 资源单价 | 每小时费用的计算 |
固定CU |
|
如2 CU的固定CU费用为2*0.0405*24*30=58.32 元/月。 |
弹性CU |
|
其中,弹性CU为实际CU使用量减去固定CU配额后的值,资源单价根据具体规格而定。 |
存储用量 | 0.0021 元/GB/小时 |
|
弹性CU费用根据您在该小时实际流量调度资源的使用情况进行计算,超出固定CU的部分将采用弹性CU进行计费。
CU选配参考
目前已开放2 CU、4 CU、6 CU、8 CU等规格,您需要根据CU用量上限评估选型。
检索增强型应用(8.17版)底层采用读写分离架构,在资源分配时将默认按照1:1的配比分配查询、写入CU资源。开启弹性计算功能后,查询CU上限与写入CU上限均为固定CU配额的1.5倍。不同的固定CU配额将影响应用的用量上限,上限关系如下表,您可结合实际用量调整配额。
CU的上限的单位为CU/s。
规格 | 弹性计算功能 | 弹性CU上限 | 应用CU总上限 | 查询CU上限 | 写入CU上限 |
固定CU配额=X CU | 开启 | 2X | 3X | 1.5X | 1.5X |
固定CU配额=Y CU | 关闭 | 0 | Y | 0.5Y | 0.5Y |
开通检索增强型应用(8.17版)
步骤一、开通服务
第一次使用ES Serverless服务时,需要进行服务开通。
在ES Serverless服务页面,单击立即开通。
进入服务开通页面,选中服务协议,单击立即开通。
步骤二、创建应用
进入创建Serverless应用的页面,选择创建实例的区域。
单击应用管理。
进入应用管理页面,单击创建应用,配置应用的基本信息。
(示例)本示例选择应用选型为检索增强型(8.17版),其他参数保持默认或自定义。
配置应用的访问设置。
(示例)本示例选择网络访问方式为公网访问,在公网访问白名单中添加本地设备的IP地址,以便使用本地设备访问Serverless应用的Kibana。
说明配置应用公网访问或私网访问,请参见配置Serverless应用公网或私网访问。
输入用户密码,登录Kibana时需要。
单击立即创建。
您可以在应用管理页面查看已创建的应用列表。请等待应用状态变为运行中,这表示应用已成功创建。随后,您可以根据个人需求,尝试体验更多功能。
本期暂时未开放Kibana使用,请通过附录一:支持的开源API进行数据推送与查询。
开放的API
检索增强型应用(8.17版)支持的API详情,请参见附录一:支持的开源API。
支持的集群及索引配置
检索增强型应用(8.17版)支持的集群及索引配置详情,请参见附录二:支持的集群及索引配置。
监控中心
详细的配置监控告警服务以及指标解释,请参见监控指标与告警配置。