Proxima CE 是基于Proxima2.x内核提供的超大规模离线向量检索引擎,用于支持批量离线向量检索任务,包括基础的向量检索、多类目检索及百万TopK检索等功能。本文为您介绍在MaxCompute中如何使用向量计算功能。
背景信息
Proxima CE是一款来自于阿里达摩院的实现向量近邻搜索的高性能软件,相比于Faiss等开源的同类产品,Proxima CE在稳定性、性能等方面都更为出色。Proxima CE的使用十分简洁,以内嵌可执行JAR包的形式提供给用户在MaxCompute上运行,支持以MaxCompute表的形式作为底库和查询向量数据的输入,整体上分为索引构建和批量查询两个主要过程,驱动多个MaxCompute MapReduce或Graph Job,完成对索引的构建和查询的检索,最终通过MaxCompute表输出批量检索的结果。
功能说明
支持的工具
上传资源、运行时支持使用odpscmd和DataWorks。
odpscmd:仅支持在Linux环境下运行,因为Proxima CE的JAR包是基于Linux平台编译的,暂不支持Windows和Mac平台。
DataWorks:您可以在DataWorks上新建MaxCompute ODPS MR节点,通过ODPS SQL脚本来运行。
使用向导
安装Proxima CE包。
使用向量计算之前您需要安装Proxima CE包,详细操作请参见安装Proxima CE包。该文档为您介绍Proxima CE的环境准备及配置流程,帮助您快速搭建Proxima CE环境。
使用向量检索功能。
该文档为您介绍向量检索功能的适用场景及使用方法。帮助您快速了解各种检索方法。
参考内容。
参考内容
指导文档
参考内容
指导文档
全量参数及内核参考
测试报告
功能测试
性能测试
常见问题
错误码处理
- 本页导读 (1)
- 背景信息
- 功能说明
- 支持的工具
- 使用向导