用自然语句从指定文档库检索向量和元数据。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action
元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:
- 对于必选的资源类型,用背景高亮的方式表示。
- 对于不支持资源级授权的操作,用
全部资源
表示。
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 |
---|---|---|---|---|
gpdb:QueryContent | create |
|
| 无 |
请求参数
名称 | 类型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
DBInstanceId | string | 是 | 实例 ID。 说明
您可以调用 DescribeDBInstances 接口查看目标地域下所有的 AnalyticDB PostgreSQL 实例的详情,包括实例 ID。
| gp-xxxxxxxxx |
Namespace | string | 否 | 命名空间,默认为 public。 说明
您可以通过 CreateNamespace 接口创建,通过 ListNamespaces 接口查看列表。
| mynamespace |
Collection | string | 是 | 文档库名称。 说明
由 CreateDocumentCollection 接口创建。您可以调用 ListDocumentCollections 接口查看已经创建的文档库。
| document |
RegionId | string | 是 | 实例所在的地域 ID。 | cn-hangzhou |
NamespacePassword | string | 是 | 命名空间对应的密码。 说明
本值为 CreateNamespace 接口指定。
| testpassword |
Content | string | 否 | 用于检索的文本内容。 | ADBPG是什么? |
Filter | string | 否 | 要查询的数据的过滤条件,格式为 SQL 的 WHERE 格式。是一个返回布尔值(真或假)的表达式,条件可以是简单的比较运算符,如等于(=)、不等于(<>或!=)、大于(>), 小于(<)、大于等于(>=)、小于等于(<=),也可以是逻辑运算符(AND, OR, NOT)组合的更复杂的表达式,以及使用 IN、BETWEEN、LIKE 等关键字的条件。 说明
| title = 'test' AND name like 'test%' |
RecallWindow | array | 否 | 召回窗口。当该值不为空时,增加返回检索结果的上下文。格式为 2 个元素的数组:List<A, B>,其中-10<=A<=0,0<=B<=10。 说明
| |
integer | 否 | 召回窗口大小。 | [-5, 5] | |
TopK | integer | 否 | 设置返回 top 结果数量。 | 10 |
RerankFactor | double | 否 | 重排因子。当该值不为空时,会对向量检索结果再做一次重排。取值范围:1<RerankFactor<=5。 说明
| 2 |
UseFullTextRetrieval | boolean | 否 | 是否使用全文检索(双路召回)。默认为 false,仅采用向量检索。 | true |
Metrics | string | 否 | 检索时的相似度算法。此值为空时则采用创建知识库时指定的算法,建议如无特殊需求不需设置。 说明
取值说明:
| cosine |
FileName | string | 否 | 以图搜图场景中,待搜索的图片源文件名。 说明
图片文件必须带有文件后缀,当前支持的图片后缀:bmp、jpg、jpeg、png、 tiff。
| test.jpg |
FileUrl | string | 否 | 以图搜图场景中,公网可访问的图片文件 URL 地址。 说明
图片文件必须带有文件后缀,当前支持的图片后缀:bmp、jpg、jpeg、png、tiff。
| https://xx/myImage.jpg |
IncludeVector | boolean | 否 | 是否返回向量。默认为 false。 说明
| true |
HybridSearch | string | 否 | 双路召回算法,默认为空(即直接将向量和全文的分数比较并排序)。 可选值:
| RRF |
HybridSearchArgs | object | 否 | 双路召回的算法参数。目前支持 RRF 和 Weight 两种:
| |
object | 否 | 双路召回的参数名。 | ||
any | 否 | 参数值。 | { "RRF": { "k": 60 } } | |
IncludeMetadataFields | string | 否 | 默认为空,表示要返回的 metadata 字段,多个字段用逗号分隔。 | title,page |
IncludeFileUrl | boolean | 否 | 是否同步返回文档的链接地址,默认不返回。 | false |
返回参数
示例
正常返回示例
JSON
格式
{
"RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521",
"Message": "success",
"Status": "success",
"Matches": {
"MatchList": [
{
"Id": "doca-1234",
"Content": "云原生数据仓库AnalyticDB PostgreSQL版提供简单、快速、经济高效的PB级云端数据仓库解决方案。",
"Metadata": {
"key": "{\"title\":\"test\"}"
},
"Vector": {
"VectorList": [
0
]
},
"FileName": "my_doc.txt",
"Score": 0.12345,
"RetrievalSource": 1,
"LoaderMetadata": "{\"page_pos\": 1}",
"FileURL": "https://xxx-cn-beijing.aliyuncs.com/image/test.png",
"RerankScore": 6.2345
}
]
},
"WindowMatches": {
"windowMatches": [
{
"WindowMatch": {
"windowMatch": [
{
"Id": "doca-2345",
"Content": "云原生数据仓库AnalyticDB PostgreSQL版是一种大规模并行处理(MPP)数据仓库服务,可提供海量数据在线分析服务。",
"Metadata": {
"key": "{\"title\":\"test\"}"
},
"FileName": "my_doc.txt",
"LoaderMetadata": "{\"page_pos\": 2}"
}
]
}
}
]
},
"EmbeddingTokens": "100",
"Usage": {
"EmbeddingTokens": "100",
"EmbeddingEntries": "10"
}
}
错误码
访问错误中心查看更多错误码。
变更历史
变更时间 | 变更内容概要 | 操作 |
---|---|---|
2024-07-18 | OpenAPI 入参发生变更 | 查看变更详情 |
2024-04-29 | OpenAPI 入参发生变更 | 查看变更详情 |
2024-04-22 | OpenAPI 入参发生变更 | 查看变更详情 |
2024-02-19 | OpenAPI 入参发生变更、OpenAPI 返回结构发生变更 | 查看变更详情 |
2024-01-17 | OpenAPI 入参发生变更、OpenAPI 返回结构发生变更 | 查看变更详情 |