java SDK使用向量检索实现最近邻查询_表格存储(Tablestore)-阿里云帮助中心

KnnVectorQuery使用数值向量进行近似最近邻查询，可以在大规模数据集中找到最相似的数据项。

目前向量检索功能处于邀测中，默认关闭。如果需要使用该功能，请提交工单进行申请或者加入钉钉群36165029092（表格存储技术交流群-3）进行咨询。

前提条件

已初始化OTSClient。具体操作，请参见初始化OTSClient。
已创建数据表并写入数据。具体操作，请参见创建数据表和写入数据。
已在数据表上创建多元索引并配置向量字段。具体操作，请参见创建多元索引。

注意事项

表格存储Java SDK从5.17.0版本开始支持向量检索功能，请确保已安装正确的表格存储Java SDK版本。
说明
关于Java SDK历史迭代版本的更多信息，请参见Java SDK历史迭代版本。
向量字段类型的个数、维度等存在限制。更多信息，请参见多元索引限制。
由于多元索引服务端是多分区的，多元索引服务端的每个分区均会返回自身最邻近的TopK个值并在协调节点进行汇总，因此如果要使用Token翻页获取所有数据，则获取到的总行数与多元索引服务端的分区数有关。

参数

参数	是否必选	说明
fieldName	是	向量字段名称。
topK	是	查询最邻近的topK个值。关于最大值的说明请参见多元索引限制。重要 K值越大，召回率越好，但是查询延迟和费用越高。当topK的值小于SearchQuery中limit的值时，服务端会自动把topK的值放大到limit的值。
float32QueryVector	是	要查询相似度的向量。
filter	否	查询过滤器，支持组合使用任意的非向量检索的查询条件。

示例

以下示例用于查询表中与指定向量最邻近的10个向量数据，并且最邻近的向量需要满足Col_Keyword列值等于"hangzhou"且Col_Long列值小于4的条件。

private static void knnVectorQuery(SyncClient client) {
    SearchQuery searchQuery = new SearchQuery();
    KnnVectorQuery query = new KnnVectorQuery();
    query.setFieldName("Col_Vector");
    query.setTopK(10); // 返回最邻近的topK。
    query.setFloat32QueryVector(new float[]{0.1f, 0.2f, 0.3f, 0.4f});
    // 最邻近的向量需要满足Col_Keyword=hangzhou && Col_Long<4条件。
    query.setFilter(QueryBuilders.bool()
            .must(QueryBuilders.term("Col_Keyword", "hangzhou"))
            .must(QueryBuilders.range("Col_Long").lessThan(4))
    );
    searchQuery.setQuery(query);
    searchQuery.setLimit(10);
    // 按照分数排序。
    searchQuery.setSort(new Sort(Collections.singletonList(new ScoreSort())));
    SearchRequest searchRequest = new SearchRequest("<TABLE_NAME>", "<SEARCH_INDEX_NAME>", searchQuery);
    SearchRequest.ColumnsToGet columnsToGet = new SearchRequest.ColumnsToGet();
    columnsToGet.setColumns(Arrays.asList("Col_Keyword", "Col_Long"));
    searchRequest.setColumnsToGet(columnsToGet);
    // 访问Search接口。
    SearchResponse resp = client.search(searchRequest);
    for (SearchHit hit : resp.getSearchHits()) {
        // 打印分数。
        System.out.println(hit.getScore());
        // 打印数据。
        System.out.println(hit.getRow());
    }
}

前提条件

注意事项

参数

示例

相关文档