OpenAI Batch接口兼容

阿里云百炼提供了与OpenAI兼容的Batch接口。您可以通过文件方式提交批量任务,任务将异步执行,在24小时内返回结果,费用为实时调用的50%。在任务运行结束前,您可以通过API进行任务状态查询,当任务结束后,可以通过API获取结果。

前提条件

  • 请开通阿里云百炼服务并获得API-KEY:获取API Key

  • 如果您通过OpenAI Python SDK使用,请通过以下命令安装最新版OpenAI SDK。

    pip3 install -U openai
  • 我们推荐您将API-KEY配置到环境变量中以降低API-KEY的泄露风险,配置方法可参考配置API Key到环境变量

支持的模型

  • qwen-turbo

  • qwen-plus

  • qwen-max

计费

Batch调用的费用为实时调用的50%,具体请参见模型列表

上传Batch输入文件

创建Batch任务前需要准备输入文件,通过文件上传接口上传后获取file_id。

文件格式为JSONL,每一行为一个JSON格式的请求,参考输入文件格式。单个Batch任务最多包含5个请求,Batch文件的大小最大100 MB,文件中单行的大小最大 1 MB(单行的请求内容还需要遵循各模型上下文长度的限制)。

用户的文件空间有限制,文件空间达到限制后,需要用户自行删除不需要的文件,释放空间。

OpenAI Python SDK

请求示例

import os
from pathlib import Path
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),  # 如果您没有配置环境变量,请在此处用您的API Key进行替换
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",  # 填写百炼服务的base_url
)

# test.jsonl 是一个本地示例文件,purpose必须是batch
file_object = client.files.create(file=Path("test.jsonl"), purpose="batch")

print(file_object.model_dump_json())
print(file_object.id)  # 打印文件id

测试文件test.jsonl内容:

{"custom_id": "request-1", "method": "POST", "url": "/v1/chat/completions", "body": {"model": "qwen-turbo", "messages": [{"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "What is 2+2?"}]}}

返回示例

{
    "id": "file-batch-xxx",
    "bytes": 231,
    "created_at": 1729065815,
    "filename": "test.jsonl",
    "object": "file",
    "purpose": "batch",
    "status": "processed",
    "status_details": null
}

HTTP

请求示例

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/files \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
--form 'file=@"test.jsonl"' \
--form 'purpose="batch"'

测试文件test.jsonl内容:

{"custom_id": "request-1", "method": "POST", "url": "/v1/chat/completions", "body": {"model": "qwen-turbo", "messages": [{"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "What is 2+2?"}]}}

返回示例

{
    "id": "file-batch-xxx",
    "bytes": 231,
    "created_at": 1729065815,
    "filename": "test.jsonl",
    "object": "file",
    "purpose": "batch",
    "status": "processed",
    "status_details": null
}

创建Batch任务

使用上传的文件创建Batch任务。

接口限流:每个阿里云主账号每分钟100,最大运行任务数100(包括所有未结束的任务,超过最大任务数,需要等任务结束后才能再创建)。

OpenAI Python SDK

请求示例

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),  # 如果您没有配置环境变量,请在此处用您的API Key进行替换
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",  # 填写百炼服务的base_url
)

batch = client.batches.create(
    input_file_id="file-batch-xxx",  # 上传文件返回的 id
    endpoint="/v1/chat/completions",  # 大语言模型固定填写,/v1/chat/completions
    completion_window="24h"  # 当前只支持24h,24小时未运行完会超时
)
print(batch)
print(batch.id)  # 打印Batch任务的id

HTTP

需要配置的endpoint

POST https://dashscope.aliyuncs.com/compatible-mode/v1/batches

请求示例

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/batches \
  -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "input_file_id": "file-batch-xxx",
    "endpoint": "/v1/chat/completions",
    "completion_window": "24h"
  }'

输入参数配置

字段

类型

传参方式

必选

描述

input_file_id

String

Body

上传文件的id,以file-batch开头

文件的purpose属性需要为batch

endpoint

string

Body

访问路径,大语言模型固定填写/v1/chat/completions

completion_window

String

Body

超时时间,当前只支持24h

metadata

Map

Body

附加信息,键值对

返回示例

{
  "id": "batch_cf957e2b-3295-4357-83af-5fb22ac17e81",
  "object": "batch",
  "endpoint": "/v1/chat/completions",
  "errors": null,
  "input_file_id": "file-batch-ADvrUmLWW8TFuKNjGDUUig1c",
  "completion_window": "24h",
  "status": "validating",
  "output_file_id": null,
  "error_file_id": null,
  "created_at": 1722503223,
  "in_progress_at": null,
  "expires_at": null,
  "finalizing_at": null,
  "completed_at": null,
  "failed_at": null,
  "expired_at": null,
  "cancelling_at": null,
  "cancelled_at": null,
  "request_counts": {
    "total": 0,
    "completed": 0,
    "failed": 0
  },
  "metadata": {}
}

返回参数

字段

类型

描述

id

String

Batch任务id

object

String

对象类型,固定值batch

endpoint

String

访问路径

errors

Map

错误信息

input_file_id

String

上传的文件id

completion_window

String

超时时间,当前只支持24h

status

String

任务状态,包括validating、failed、in_progress、finalizing、completed、expiring、expired、cancelling、cancelled

output_file_id

String

执行成功请求的输出文件id

error_file_id

String

执行错误请求的输出文件id

created_at

Integer

任务创建的Unix 时间戳(秒)

in_progress_at

Integer

任务开始运行的Unix时间戳(秒)

expires_at

Integer

任务开始超时的时间戳(秒)

finalizing_at

Integer

任务最后开始时间戳(秒)

completed_at

Integer

任务完成的时间戳(秒)

failed_at

Integer

任务失败的时间戳(秒)

expired_at

Integer

任务超时的时间戳(秒)

cancelling_at

Integer

任务设置为取消中的时间戳(秒)

cancelled_at

Integer

任务取消的时间戳(秒)

request_counts

Map

不同状态的请求数量

metadata

Map

附加信息,键值对

查询Batch任务

您可以将batch_id替换为实际值,来查询指定Batch任务的信息。

接口限流:每个阿里云主账号每分钟300(由于Batch任务执行需要一些时间,建议创建Batch任务之后,每分钟调用1次该查询接口获取任务信息)。

OpenAI Python SDK

请求示例

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),  # 如果您没有配置环境变量,请在此处用您的API Key进行替换
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",  # 填写百炼服务的base_url
)
batch = client.batches.retrieve("batch_id")  # 将batch_id替换为Batch任务的id
print(batch)
print(batch.output_file_id)  # 打印输出文件id

HTTP

需要配置的endpoint

GET https://dashscope.aliyuncs.com/compatible-mode/v1/batches/batch_id

请求示例

curl --request GET 'https://dashscope.aliyuncs.com/compatible-mode/v1/batches/batch_id' \
 -H "Authorization: Bearer $DASHSCOPE_API_KEY"

输入参数配置

字段

类型

传参方式

必选

描述

batch_id

String

Path

需要查询的Batch任务的id,例如“batch_xxx”

返回示例

请参见创建Batch任务的返回示例。

返回参数

请参见创建Batch任务的返回参数。

返回参数中output_file_iderror_file_id可以通过下载Batch任务结果文件获取内容。

下载Batch结果文件

Batch任务执行完成后,可以通过下载文件接口下载Batch结果文件,参见文档:下载Batch任务结果文件

取消Batch任务

您可以将batch_id替换为实际值,来取消指定的Batch任务。

接口限流:每个阿里云主账号每分钟100

OpenAI Python SDK

请求示例

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),  # 如果您没有配置环境变量,请在此处用您的API Key进行替换
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",  # 填写DashScope服务的base_url
)
batch = client.batches.cancel("batch_id")  # 将batch_id替换为Batch任务的id
print(batch)

HTTP

需要配置的endpoint

POST https://dashscope.aliyuncs.com/compatible-mode/v1/batches/batch_id/cancel

请求示例

curl --request POST 'https://dashscope.aliyuncs.com/compatible-mode/v1/batches/batch_id/cancel' \
 -H "Authorization: Bearer $DASHSCOPE_API_KEY"

输入参数配置

字段

类型

传参方式

必选

描述

batch_id

String

Path

需要取消的Batch任务的id,例如“batch_xxx”

返回示例

请参见创建Batch任务的返回示例。

返回参数

请参见创建Batch任务的返回参数。

查询Batch任务列表

您可以将after="batch_id"中的batch_id替换为实际值,在后续查询时可以从指定的Batch任务开始获取下一页的Batch任务,并通过limit来指定返回任务的数量。

接口限流:每个阿里云主账号每分钟100

OpenAI Python SDK

请求示例

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),  # 如果您没有配置环境变量,请在此处用您的API Key进行替换
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",  # 填写DashScope服务的base_url
)
batches = client.batches.list(after="batch_id", limit=20)  # 将batch_id替换为Batch任务的id
print(batches)

HTTP

需要配置的endpoint

GET https://dashscope.aliyuncs.com/compatible-mode/v1/batches?limit=20&after=batch_id

请求示例

curl --request GET  'https://dashscope.aliyuncs.com/compatible-mode/v1/batches?limit=20&after=batch_id' \
 -H "Authorization: Bearer $DASHSCOPE_API_KEY"

输入参数配置

字段

类型

传参方式

必选

描述

after

String

Query

用于分页的游标,参数after的取值为Batch任务id,表示查询该ID之后的数据。分页查询时,可以将返回结果中的last_id赋值给该参数,以获取下一页的数据。

例如,若本次查询返回了20行数据,且最后一个Batch任务id(即last_id)是batch_xxx,则后续查询时可以设置after=batch_xxx,以获取列表的下一页。

limit

Integer

Query

返回数量,范围[1,100],默认20。

返回示例

{
  "object": "list",
  "data": [
    {
      "id": "batch_b8b6a83e-00a3-4068-81d9-0a1705bf6b2c",
      "object": "batch",
      "endpoint": "/v1/chat/completions",
      "errors": null,
      "input_file_id": "file-batch-IvxTEDheD70YmyXfqrkE2t64",
      "completion_window": "24h",
      "status": "completed",
      "output_file_id": "file-batch_output-fUy6gxJCyHzT0WHDg2SInyTp",
      "error_file_id": null,
      "created_at": 1722234109,
      "in_progress_at": 1722234109,
      "expires_at": null,
      "finalizing_at": 1722234165,
      "completed_at": 1722234165,
      "failed_at": null,
      "expired_at": null,
      "cancelling_at": null,
      "cancelled_at": null,
      "request_counts": {
        "total": 100,
        "completed": 95,
        "failed": 5
      },
      "metadata": {}
    },
    { ... }
  ],
  "first_id": "batch_b8b6a83e-00a3-4068-81d9-0a1705bf6b2c",
  "last_id": "batch_ca912d83-e9e8-4cf2-89a4-d29743e334e4",
  "has_more": true
}

返回参数

字段

类型

描述

object

String

类型,固定值list

data

Array

Batch任务对象,参见创建Batch任务的返回参数

first_id

String

当前页第一个id

last_id

String

当前页最后一个id

has_more

Boolean

是否有下一页

输入文件格式

JSONL文件,每一行一个JSON格式的请求。单个Batch任务最多包含5个请求,Batch文件的大小最大100 MB,文件中单行的大小最大 1 MB(单行的请求内容还需要遵循各模型上下文长度的限制)。

示例

{"custom_id": "request-1", "method": "POST", "url": "/v1/chat/completions", "body": {"model": "qwen-turbo", "messages": [{"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "What is 2+2?"}]}}

参数

字段

类型

必选

描述

custom_id

String

用户自定义的请求id,文件中唯一

method

String

请求方法,当前只支持POST

url

String

API关联的URL,当前支持:/v1/chat/completions

body

Object

模型调用的请求体

输出文件格式

JSONL文件,每一行一个JSON。

示例

{"id": "batch_req_wnaDys", "custom_id": "request-2", "response": {"status_code": 200, "request_id": "req_c187b3", "body": {"id": "chatcmpl-9758Iw", "object": "chat.completion", "created": 1711475054, "model": "qwen-max", "choices": [{"index": 0, "message": {"role": "assistant", "content": "2 + 2 equals 4."}, "finish_reason": "stop"}], "usage": {"prompt_tokens": 24, "completion_tokens": 15, "total_tokens": 39}, "system_fingerprint": null}}, "error": null}

参数

字段

类型

必选

描述

id

String

请求id

custom_id

String

用户自定义的请求id

response

Object

请求结果

error

Object

异常响应结果

error.code

String

错误码

error.message

String

错误信息

常见问题

  1. 这几个模块的Batch定价,对应的模型也有基础限流吗?

    答:实时调用才会有QPM(Queries Per Minute:每分钟处理请求数)限流,Batch调用没有 QPM 限流。

  2. 使用Batch调用,是否需要下单,在哪里下单?

    答:Batch是一种调用方式,无需额外下单。该调用方式为后付费计价模式,按照Batch接口调用直接付费。

  3. 提交的Batch调用请求,后台如何处理? 是根据提交请求的先后顺序来执行吗?

    答:不是排队机制,是调度机制,根据资源情况来调度和执行Batch请求任务。

  4. 报错如何处理?

    答:请参见错误码