CreateDatasetJob - 创建数据集任务

创建数据集任务。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用前面加 * 表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
paidataset:CreateDatasetJobcreate
*全部资源
*

请求语法

POST /api/v1/datasets/{DatasetId}/datasetjobs HTTP/1.1

请求参数

名称类型必填描述示例值
DatasetIdstring

数据集 ID。如何获取数据集 ID,详情请参见 ListDatasets

d-rbvg5wz****c9ks92
bodyobject

请求体。

DatasetVersionstring

数据集版本名称。

v1
WorkspaceIdstring

工作空间 ID。如何获取工作空间 ID,请参见 ListWorkspaces

478**
JobActionstring

任务操作。

枚举值:
  • SemanticIndex语义索引
  • IntelligentTag智能打标
  • FileMetaExport元数据导出
SemanticIndex
JobModestring

任务类型。

枚举值:
  • Full全量模式
Full
Descriptionstring

描述。

这是一个任务描述。
JobSpecstring

任务明细。

{\"modelId\":\"xxx\"}

CreateDatasetJob 中的 JobSpec 参数说明: (1)语义索引任务

示例: { "modelId": "xxx", "modelVersion": "1.0.0", "contentList": ["file"] }

其中 modelId 为模型 ID,modelVersion 为模型版本,contentList 为索引内容,目前只支持 file(文件)。

(2)智能打标任务

示例: { "modelId": "qwen-max-0428" }

其中 modelId 为打标模型 ID。

(3)元数据导出任务

示例: { "source": "TAG", "queryText": "汽车", "topK": 100, "scoreThreshold":0.6, "fileUri": "oss://mybucket.oss-cn-beijing.aliyuncs.com/mypath" }

其中 source 表示结果来源,值为 TAG 表示来源为标签,值为 VECTOR 表示来源为 embedding 向量; queryText 表示待搜索文本内容; topK 表示导出最大数量; scoreThreshold 表示相似度得分,只返回大于 ScoreThreshold 的结果,在 Source=VECTOR 时有效; fileUri 表示导出文件的 OSS 存储路径。

返回参数

名称类型描述示例值
object

返回结构体。

RequestIdstring

请求 ID。

99341606-****-0757724D97EE
DatasetJobIdstring

数据集任务 ID

dsjob-9jx1******uj9e

示例

正常返回示例

JSON格式

{
  "RequestId": "99341606-****-0757724D97EE",
  "DatasetJobId": "dsjob-9jx1******uj9e"
}

错误码

访问错误中心查看更多错误码。