检索增强型应用(8.17版)

随着生成式AI和实时数据分析需求的激增,开发者迫切需要兼顾高性能、低成本且免运维的检索服务。阿里云Elasticsearch Serverless检索增强型应用(8.17版)基于官方Elasticsearch 8.17版本,深度融合了无服务器架构与分层扩展能力,以满足信息检索、向量搜索、语义分析等通用场景的需求,并提供全托管服务。本文为您介绍检索增强型应用(8.17版)的最新特性、费用说明、服务开通及应用创建等内容。

商业化说明

检索增强型应用(8.17版)将于北京时间202562718:00起进行商业化收费。届时,使用该服务将按照相关计费项收取相应费用。

说明

若您无需再使用该服务,请于商业化收费前关闭服务,以免产生费用。如有任何问题,请提交工单或通过用户钉钉交流群(群号为72335013004)联系技术支持人员处理。

最新特性

检索增强型应用(8.17版)在新特性支持、弹性性能优化及成本效率方面均有显著提升。相比此前的检索通用型(7.10版),新版本提供了更强大的功能和更灵活的使用体验:

  • 新特性支持:检索增强型应用(8.17 版)针对向量检索场景进行了全面优化,新增对稀疏向量和稠密向量的支持等功能,具体参考附录一:支持的开源API

  • 弹性性能:新版架构经过全面升级,在应用配额范围内,弹性资源调度更加灵活,请求响应速度显著提升,为您提供更高效的性能体验。

  • 成本优化:相比7.10版本的按量付费模式,8.17版本引入了预留固定配额+按需弹性调用的计费方式。通过灵活组合两种模式,您可以更高效地利用资源,从而有效降低整体使用成本。

费用说明

检索增强型应用(8.17版)将根据预留固定CU配额、按需使用的弹性CU以及存储空间消耗费用进行收费。计费详情请参见计费说明

CU选配参考

目前已开放2 CU、4 CU、6 CU、8 CU等规格,您需要根据CU用量上限评估选型。

检索增强型应用(8.17版)底层采用读写分离架构,在资源分配时将默认按照1:1的配比分配查询、写入CU资源。开启弹性计算功能后,查询CU上限与写入CU上限均为固定CU配额的1.5倍。不同的固定CU配额将影响应用的用量上限,上限关系如下表,您可结合实际用量调整配额。

说明

CU的上限的单位为CU/s。

规格

弹性计算功能

弹性CU上限

应用CU总上限

查询CU上限

写入CU上限

固定CU配额=X CU

开启

2X

3X

1.5X

1.5X

固定CU配额=Y CU

关闭

0

Y

0.5Y

0.5Y

创建检索增强型应用(8.17版)

说明

当您首次创建ES Serverless任意应用时,系统会自动为您开通该服务,服务开通即代表您已悉知并同意相关服务协议。应用创建成功后,将按照相应计费标准进行收费,若未创建成功,则不会产生任何费用。

  1. 创建应用。

    1. 进入Serverless应用创建页面,选择创建实例的地域。

    2. 应用管理页面,单击创建应用

  2. 配置应用的基本信息。

    输入应用名称,选择应用类型为检索增强型,其他参数保持默认或自定义。

  3. 配置应用的访问信息。

    • 本文示例网络访问方式配置为公网访问,在公网访问白名单中添加本地设备的IP地址,以便使用本地设备访问Serverless应用的Kibana。配置应用的网络访问,请参见配置Serverless应用公网或私网访问

    • 输入用户密码,后续登录Kibana时需要使用。

  4. 单击立即创建

您可在应用管理页面查看已创建的应用列表。等待应用状态变为运行中,表示应用已创建成功。随后,您可根据个人需求,尝试体验更多功能。

开放的API

检索增强型应用(8.17版)支持的API详情,请参见附录一:支持的开源API

支持的集群及索引配置

检索增强型应用(8.17版)支持的集群及索引配置详情,请参见附录二:支持的集群及索引配置

支持的插件

检索增强型应用(8.17版)支持的插件详情,请参见附录三:支持的插件

监控中心

详细的配置监控告警服务以及指标解释,请参见监控指标与告警配置