QueryCollectionData - 召回向量数据
召回向量数据。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
调试
授权信息
|
操作 |
访问级别 |
资源类型 |
条件关键字 |
关联操作 |
|
gpdb:QueryCollectionData |
create |
*Collection
|
无 | 无 |
请求参数
|
名称 |
类型 |
必填 |
描述 |
示例值 |
| DBInstanceId |
string |
否 |
实例 ID。 说明
您可以调用 DescribeDBInstances 接口查看目标地域下所有的 AnalyticDB PostgreSQL 实例的详情,包括实例 ID。 |
gp-xxxxxxxxx |
| Collection |
string |
是 |
集合名。 说明
您可以通过 ListCollections 接口查看列表。 |
document |
| Namespace |
string |
否 |
命名空间。 说明
您可以通过 ListNamespaces 查看列表。 |
mynamespace |
| NamespacePassword |
string |
是 |
命名空间对应的密码。 |
testpassword |
| Content |
string |
否 |
用于全文检索的内容。即此值为空时,仅使用向量检索;不为空时,使用向量和全文双路检索。 说明
和 Vector 参数不能同时为空。 |
hello_world |
| Filter |
string |
否 |
要查询的数据的过滤条件,格式为 SQL 的 WHERE 格式。是一个返回布尔值(真或假)的表达式,条件可以是简单的比较运算符,如等于(=)、不等于(<>或!=)、大于(>), 小于(<)、大于等于(>=)、小于等于(<=),也可以是逻辑运算符(AND, OR, NOT)组合的更复杂的表达式,以及使用 IN、BETWEEN、LIKE 等关键字的条件。 说明
|
pipeline_id='1yhpmo0rbn' AND (spu='10025667796135' AND dept_id='226') |
| TopK |
integer |
是 |
设置返回 top 结果数量。 |
10 |
| Vector |
array |
否 |
向量数据,长度和 CreateCollection 接口的维度一致。 说明
|
|
|
number |
否 |
向量数据。 |
1.234 |
|
| SparseVector |
object |
否 |
稀疏向量数据列表。 |
|
| Indices |
array |
否 |
下标数组。 说明
列表大小不能超过 4000。 |
|
|
integer |
否 |
下标值。 |
1 |
|
| Values |
array |
否 |
稀疏向量数组。 |
|
|
number |
否 |
稀疏向量数据。 |
1.2345 |
|
| RegionId |
string |
是 |
实例所在地域 ID。 |
cn-hangzhou |
| Metrics |
string |
否 |
检索时的相似度算法。取值说明:
说明
此值为空时,则使用构建索引时指定的算法。 |
cosine |
| IncludeValues |
boolean |
否 |
是否返回稠密向量数据。取值说明:
|
true |
| HybridSearch |
string |
否 |
双路召回算法,默认为空(即直接将向量和全文的分数比较并排序)。 可选值:
|
RRF |
| HybridSearchArgs |
object |
否 |
双路召回的算法参数。目前支持 RRF 和 Weight 两种:
|
|
|
object |
否 |
召回算法。 |
||
|
any |
否 |
召回算法配置。 |
{ "RRF": { "k": 60 } } |
|
| OrderBy |
string |
否 |
默认为空,表示排序的依据字段。不支持双路召回场景。 字段必须属于 metadata 或表里的默认字段比如 id,格式支持:
|
chunk_id |
| Offset |
integer |
否 |
默认为空,表示分页查询时的检索起点。不支持双路召回场景。 范围必须>=0。当此值不为空时,会返回 Total 表示总的命中数。此参数配合 TopK 使用,比如要分页 20 检索 chunk_id 0~44 的 chunks,则要请求 3 次:
|
0 |
| IncludeMetadataFields |
string |
否 |
默认为空,表示要返回的 metadata 字段,多个字段用逗号分隔。 |
title,content |
| WorkspaceId |
string |
否 |
多数据库实例组成的 Workspace 的 Id。此参数和 DBInstanceId 参数不能同时为空,当和 DBInstanceId 同时指定时以此参数为准。 |
gp-ws-***** |
| RelationalTableFilter |
object |
否 |
使用另外一张关系表实现向量数据过滤(类似 Join 的功能)。 说明
关系表的数据可以通过设置 IncludeMetadataFields 参数返回。比如 rds_table_name.id 表示返回关系表的 id 字段。 |
|
| CollectionMetadataField |
string |
否 |
向量集的 Metadata 字段,用来和向量表的字段关联。 |
doc_id |
| TableField |
string |
否 |
关系表的字段,用来和向量集的 Metadata 的字段做关联。 |
id |
| TableName |
string |
否 |
关系表的名称。 |
my_rds_table |
| Condition |
string |
否 |
关系表的过滤条件。 |
tags @> ARRAY['art'] |
| IncludeSparseValues |
boolean |
否 |
是否返回稀疏向量数据。取值说明:
|
false |
返回参数
|
名称 |
类型 |
描述 |
示例值 |
|||||||||||||||||||||
|
object |
召回结果。 |
|||||||||||||||||||||||
| Matches |
object |
|||||||||||||||||||||||
| match |
array<object> |
数据列表。 |
||||||||||||||||||||||
|
array<object> |
单条记录。 |
|||||||||||||||||||||||
| Id |
string |
向量数据的唯一 ID。 |
doca-1234 |
|||||||||||||||||||||
| Metadata |
object |
元数据。 |
||||||||||||||||||||||
|
string |
元数据内容。 |
{"title":"test title", "content": "test content"} |
||||||||||||||||||||||
| Values |
object |
|||||||||||||||||||||||
| value |
array |
向量数据列表。 |
||||||||||||||||||||||
|
number |
向量数据。 |
1.234 |
||||||||||||||||||||||
| Score |
number |
此条数据的相似度分数,其分数算法和创建索引时指定的算法 |
0.12345 |
|||||||||||||||||||||
| SparseValues |
object |
稀疏向量返回体 |
||||||||||||||||||||||
| Indices |
object |
|||||||||||||||||||||||
| Indice |
array |
稀疏向量索引数组 |
||||||||||||||||||||||
|
integer |
稀疏向量索引值 |
20 |
||||||||||||||||||||||
| Values |
object |
|||||||||||||||||||||||
| Value |
array |
稀疏向量值数组 |
||||||||||||||||||||||
|
number |
稀疏向量值 |
0.222 |
||||||||||||||||||||||
| MetadataV2 |
object |
元数据。值与 Metadata 一致,元素类型区别于 Metadata,用于在 SDK 端透出任意类型。 |
||||||||||||||||||||||
|
any |
该字段可容纳多种数据类型,由 SDK 按以下规则进行反序列化。 说明
反序列化规则
|
{'array_field': [15.5, 25.5, 35.5], 'float_field': 128.45, 'long_field': 123456789017, 'bool_field': False, 'json_field': '{"key1":"value1","num":999.0}', 'char_array_field': '[c, h, a, r, s, 5]', 'int_field': 128, 'source': 0, 'double_field': 12350.6789, 'string_field': 'test_string_5'} |
||||||||||||||||||||||
| RequestId |
string |
请求 ID。 |
ABB39CC3-4488-4857-905D-2E4A051D0521 |
|||||||||||||||||||||
| Status |
string |
状态,取值说明:
|
success |
|||||||||||||||||||||
| Message |
string |
请求失败时的详细信息。 |
0.1234 |
|||||||||||||||||||||
| Total |
integer |
当请求 Offset 不为 0 时才返回,返回值为该检索条件的命中总数。 |
100 |
示例
正常返回示例
JSON格式
{
"Matches": {
"match": [
{
"Id": "doca-1234",
"Metadata": {
"key": "{\"title\":\"test title\", \"content\": \"test content\"}"
},
"Values": {
"value": [
1.234
]
},
"Score": 0.12345,
"SparseValues": {
"Indices": {
"Indice": [
20
]
},
"Values": {
"Value": [
0.222
]
}
},
"MetadataV2": {
"key": "{'array_field': [15.5, 25.5, 35.5], 'float_field': 128.45, 'long_field': 123456789017, 'bool_field': False, 'json_field': '{\"key1\":\"value1\",\"num\":999.0}', 'char_array_field': '[c, h, a, r, s, 5]', 'int_field': 128, 'source': 0, 'double_field': 12350.6789, 'string_field': 'test_string_5'}"
}
}
]
},
"RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521",
"Status": "success",
"Message": "0.1234",
"Total": 100
}
错误码
访问错误中心查看更多错误码。
变更历史
更多信息,参考变更详情。