如何通过api调用qwen开源模型_大模型服务平台百炼(Model Studio)-阿里云帮助中心

通义千问开源系列模型具有强大的自然语言处理能力，您可以通过API接口调用通义千问模型，将通义千问模型集成到您的业务中。

前提条件

请您参考获取API-KEY，开通百炼服务并获得API-KEY。
请在模型概览中选择您需要使用的模型。

您可以使用OpenAI Python SDK、DashScope SDK或HTTP接口调用通义千问模型，请您根据您的需求，参考以下方式准备您的计算环境。

说明

如果您之前使用OpenAI SDK以及HTTP方式调用OpenAI的服务，只需在原有框架下调整API-KEY、base_url、model等参数，就可以直接调用通义千问模型。

调用方式	准备条件
通过OpenAI Python SDK调用	您可以通过以下命令安装或更新OpenAI SDK： `# 如果下述命令报错，请将pip替换为pip3 pip install -U openai` 您需要配置的base_url如下： `https://dashscope.aliyuncs.com/compatible-mode/v1`
通过OpenAI兼容-HTTP调用	如果您需要通过OpenAI兼容的HTTP方式进行调用，需要配置的完整访问endpoint如下： `POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions`
通过DashScope SDK调用	DashScope SDK提供了Python和Java两个版本，请参考安装SDK，安装最新版SDK。
通过DashScope HTTP调用	如果您需要通过DashScope的HTTP方式进行调用，需要配置的完整访问endpoint如下： `POST https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation`

说明

我们推荐您将API-KEY配置到环境变量中以降低API-KEY的泄漏风险，详情可参考通过环境变量配置API-KEY。您也可以在代码中配置API-KEY，但是会存在泄露风险。

场景示例

单轮对话

您可以参考以下示例代码，通过OpenAI或者DashScope的方式体验通义千问开源系列模型的单轮对话能力。

OpenAI兼容

您可以通过OpenAI SDK或OpenAI兼容的HTTP方式调用通义千问模型，体验单轮对话的功能。

Python

示例代码

from openai import OpenAI
import os

def get_response():
    client = OpenAI(
        api_key=os.getenv("DASHSCOPE_API_KEY"), # 如果您没有配置环境变量，请在此处用您的API Key进行替换
        base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",  # 填写DashScope服务的base_url
    )
    completion = client.chat.completions.create(
        model="qwen2-72b-instruct",
        messages=[
            {'role': 'system', 'content': 'You are a helpful assistant.'},
            {'role': 'user', 'content': '你是谁？'}],
        temperature=0.8,
        top_p=0.8
        )
    print(completion.model_dump_json())

if __name__ == '__main__':
    get_response()

返回结果

{
  "id": "chatcmpl-2399bcfb-6f3d-9269-bab2-7d2f4a68b3e5",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null,
      "message": {
        "content": "我是阿里云开发的一款超大规模语言模型，我叫通义千问。",
        "role": "assistant",
        "function_call": null,
        "tool_calls": null
      }
    }
  ],
  "created": 1721643915,
  "model": "qwen2-72b-instruct",
  "object": "chat.completion",
  "service_tier": null,
  "system_fingerprint": null,
  "usage": {
    "completion_tokens": 17,
    "prompt_tokens": 22,
    "total_tokens": 39
  }
}

curl

示例代码

curl --location "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
    "model": "qwen2-72b-instruct",
    "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant."
        },
        {
            "role": "user", 
            "content": "你是谁？"
        }
    ]
}'

返回结果

{
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "我是阿里云开发的一款超大规模语言模型，我叫通义千问。"
      },
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null
    }
  ],
  "object": "chat.completion",
  "usage": {
    "prompt_tokens": 22,
    "completion_tokens": 17,
    "total_tokens": 39
  },
  "created": 1721643950,
  "system_fingerprint": null,
  "model": "qwen2-72b-instruct",
  "id": "chatcmpl-2b14edf9-c4c2-9e2c-a4e9-35fa3b7d1268"
}

DashScope

您可以通过DashScope SDK或HTTP方式调用通义千问模型，体验单轮对话的功能。

Python

示例代码

import random
from http import HTTPStatus
# 建议dashscope SDK 的版本 >= 1.14.0
from dashscope import Generation


def call_with_messages():
    messages = [{'role': 'system', 'content': 'You are a helpful assistant.'},
                {'role': 'user', 'content': '你是谁？'}]
    response = Generation.call(model="qwen2-72b-instruct",
                               messages=messages,
                               # 设置随机数种子seed，如果没有设置，则随机数种子默认为1234
                               seed=random.randint(1, 10000),
                               temperature=0.8,
                               top_p=0.8,
                               top_k=50,
                               # 将输出设置为"message"格式
                               result_format='message')
    if response.status_code == HTTPStatus.OK:
        print(response)
    else:
        print('Request id: %s, Status code: %s, error code: %s, error message: %s' % (
            response.request_id, response.status_code,
            response.code, response.message
        ))


if __name__ == '__main__':
    call_with_messages()

返回结果

{
  "status_code": 200,
  "request_id": "ac0a0baa-1033-903c-bb4f-9b2c52a0532c",
  "code": "",
  "message": "",
  "output": {
    "text": null,
    "finish_reason": null,
    "choices": [
      {
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "我是通义千问，由阿里云开发的AI助手。我被设计用来回答各种问题、提供信息和与用户进行对话。有什么我可以帮助你的吗？"
        }
      }
    ]
  },
  "usage": {
    "input_tokens": 22,
    "output_tokens": 36,
    "total_tokens": 58
  }
}

Java

示例代码

// Copyright (c) Alibaba, Inc. and its affiliates.
// 建议dashscope SDK的版本 >= 2.12.0
import java.util.Arrays;
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.utils.JsonUtils;

public class Main {

    public static GenerationResult callWithMessage() throws ApiException, NoApiKeyException, InputRequiredException {
        Generation gen = new Generation();

        Message systemMsg = Message.builder()
                .role(Role.SYSTEM.getValue())
                .content("You are a helpful assistant.")
                .build();

        Message userMsg = Message.builder()
                .role(Role.USER.getValue())
                .content("你是谁？")
                .build();

        GenerationParam param = GenerationParam.builder()
                .model("qwen2-72b-instruct")
                .messages(Arrays.asList(systemMsg, userMsg))
                .resultFormat(GenerationParam.ResultFormat.MESSAGE)
                .topK(50)
                .temperature(0.8f)
                .topP(0.8)
                .seed(1234)
                .build();

        return gen.call(param);
    }

    public static void main(String[] args) {
        try {
            GenerationResult result = callWithMessage();
            System.out.println(JsonUtils.toJson(result));
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            // 使用日志框架记录异常信息
            // Logger.error("An error occurred while calling the generation service", e);
            System.err.println("An error occurred while calling the generation service: " + e.getMessage());
        }
        System.exit(0);
    }
}

返回结果

{
  "requestId": "bfd9d25a-f355-974d-ab02-b6ca306ebcba",
  "usage": {
    "input_tokens": 22,
    "output_tokens": 17,
    "total_tokens": 39
  },
  "output": {
    "choices": [
      {
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "我是阿里云开发的一款超大规模语言模型，我叫通义千问。"
        }
      }
    ]
  }
}

curl

示例代码

curl --location "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
    "model": "qwen2-72b-instruct",
    "input":{
        "messages":[      
            {
                "role": "system",
                "content": "You are a helpful assistant."
            },
            {
                "role": "user",
                "content": "你是谁？"
            }
        ]
    },
    "parameters": {
        "result_format": "message"
    }
}'

返回结果

{
  "output": {
    "choices": [
      {
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "我是阿里云开发的一款超大规模语言模型，我叫通义千问。"
        }
      }
    ]
  },
  "usage": {
    "total_tokens": 39,
    "output_tokens": 17,
    "input_tokens": 22
  },
  "request_id": "ff885277-3344-9bc6-b042-bf76454044ee"
}

多轮对话

相比于单轮对话，多轮对话可以让大模型参考历史对话信息，更符合日常交流的场景。实现多轮对话的关键在于维护一个存放历史对话信息的列表，并将更新后的列表作为大模型的输入，从而使大模型可以参考历史对话信息进行回复。您可以参考以下示例代码，将每一轮的对话历史添加到messages列表中，实现多轮对话的功能。

说明

如果对话轮数较多，可能会超过大模型可以输入的token上限。您可以采用对话历史摘要、固定窗口大小等方法，控制输入大模型的token数量。

OpenAI兼容

您可以通过OpenAI SDK或OpenAI兼容的HTTP方式调用通义千问模型，体验多轮对话的功能。

Python

示例代码

from openai import OpenAI
import os

def get_response(messages):
    client = OpenAI(
        # 如果您没有配置环境变量，请在此处用您的API Key进行替换
        api_key=os.getenv("DASHSCOPE_API_KEY"), 
        # 填写DashScope服务的base_url
        base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    )
    completion = client.chat.completions.create(
        model="qwen2-72b-instruct",
        messages=messages,
        temperature=0.8,
        top_p=0.8
        )
    return completion

messages = [{'role': 'system', 'content': 'You are a helpful assistant.'}]
# 您可以自定义设置对话轮数，当前为3
for i in range(3):
    user_input = input("请输入：")
    # 将用户问题信息添加到messages列表中
    messages.append({'role': 'user', 'content': user_input})
    assistant_output = get_response(messages).choices[0].message.content
    # 将大模型的回复信息添加到messages列表中
    messages.append({'role': 'assistant', 'content': assistant_output})
    print(f'用户输入：{user_input}')
    print(f'模型输出：{assistant_output}')
    print('\n')

返回结果

2024-04-08_18-58-36 (1).gif

curl

示例代码

curl --location "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
    "model": "qwen2-72b-instruct",
    "messages":[      
        {
            "role": "system",
            "content": "You are a helpful assistant."
        },
        {
            "role": "user",
            "content": "你好"
        },
        {
            "role": "assistant",
            "content": "你好啊，我是通义千问。"
        },
        {
            "role": "user",
            "content": "你有哪些技能？"
        }
    ],
    "seed":1234,
    "top_p":0.8,
    "temperature":0.8
}'

返回结果

{
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "我有以下技能：\n1. 回答问题：我可以回答各种领域的问题，包括但不限于科学、技术、文化、历史、地理等等。\n2. 生成文本：我可以根据给定的提示或主题生成文章、故事、诗歌等文本内容。\n3. 翻译语言：我可以将文本从一种语言翻译成另一种语言，支持多种语言之间的互译。\n4. 编写代码：我可以编写简单的代码片段，帮助用户解决编程方面的问题。\n5. 提供建议：我可以为用户提供各种建议，如生活、学习、工作等方面的建议。\n6. 聊天互动：我可以与用户进行自然语言的对话，提供陪伴和娱乐。\n\n这些只是我的一些基本技能，实际上我可以做更多的事情。如果你有任何问题或需要帮助，随时可以问我！"
      },
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null
    }
  ],
  "object": "chat.completion",
  "usage": {
    "prompt_tokens": 43,
    "completion_tokens": 169,
    "total_tokens": 212
  },
  "created": 1721644509,
  "system_fingerprint": null,
  "model": "qwen2-72b-instruct",
  "id": "chatcmpl-c5e9a3e5-f327-9454-80d7-1a156f6c42a1"
}

DashScope

您可以通过DashScope SDK或HTTP方式调用通义千问模型，体验多轮对话的功能。

Python

示例代码

from dashscope import Generation

def get_response(messages):
    response = Generation.call(model="qwen2-72b-instruct",
                               messages=messages,
                               # 将输出设置为"message"格式
                               result_format='message')
    return response


messages = [{'role': 'system', 'content': 'You are a helpful assistant.'}]

# 您可以自定义设置对话轮数，当前为3
for i in range(3):
    user_input = input("请输入：")
    # 将用户问题信息添加到messages列表中
    messages.append({'role': 'user', 'content': user_input})
    assistant_output = get_response(messages).output.choices[0]['message']['content']
    # 将大模型的回复信息添加到messages列表中
    messages.append({'role': 'assistant', 'content': assistant_output})
    print(f'用户输入：{user_input}')
    print(f'模型输出：{assistant_output}')
    print('\n')

返回结果

2024-04-08_18-58-36 (1).gif

Java

示例代码

import java.util.ArrayList;
import java.util.List;
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import java.util.Scanner;

public class Main {

    public static GenerationParam createGenerationParam(List<Message> messages) {
        return GenerationParam.builder()
                .model("qwen2-72b-instruct")
                .messages(messages)
                .resultFormat(GenerationParam.ResultFormat.MESSAGE)
                .topP(0.8)
                .build();
    }

    public static GenerationResult callGenerationWithMessages(GenerationParam param) throws ApiException, NoApiKeyException, InputRequiredException {
        Generation gen = new Generation();
        return gen.call(param);
    }

    public static void main(String[] args) {
        try {
            List<Message> messages = new ArrayList<>();

            messages.add(createMessage(Role.SYSTEM, "You are a helpful assistant."));
            for (int i = 0; i < 3;i++) {
                Scanner scanner = new Scanner(System.in);
                System.out.print("请输入：");
                String userInput = scanner.nextLine();
                if ("exit".equalsIgnoreCase(userInput)) {
                    break;
                }
                messages.add(createMessage(Role.USER, userInput));
                GenerationParam param = createGenerationParam(messages);
                GenerationResult result = callGenerationWithMessages(param);
                System.out.println("模型输出："+result.getOutput().getChoices().get(0).getMessage().getContent());
                messages.add(result.getOutput().getChoices().get(0).getMessage());
            }
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            e.printStackTrace();
        }
        System.exit(0);
    }

    private static Message createMessage(Role role, String content) {
        return Message.builder().role(role.getValue()).content(content).build();
    }
}

返回结果

2024-04-08_18-58-36 (1).gif

curl

示例代码

curl --location "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
    "model": "qwen2-72b-instruct",
    "input":{
        "messages":[      
            {
                "role": "system",
                "content": "You are a helpful assistant."
            },
            {
                "role": "user",
                "content": "你好"
            },
            {
                "role": "assistant",
                "content": "你好啊，我是通义千问。"
            },
            {
                "role": "user",
                "content": "你有哪些技能？"
            }
        ]
    },
    "parameters": {
        "result_format": "message",
        "top_p":0.8,
        "top_k": 50,
        "temperature":0.8
    }
}'

返回结果

{
  "output": {
    "choices": [
      {
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "我有以下技能：\n1. 回答问题：我可以回答各种领域的问题，包括但不限于科学、技术、文化、历史、地理等等。\n2. 提供信息：我可以提供实时天气、新闻、股票等信息。\n3. 生成文本：我可以根据给定的提示或主题生成各种类型的文本，如故事、诗歌、文章等等。\n4. 翻译语言：我可以翻译多种语言，包括但不限于中文、英文、法文、西班牙文等等。\n5. 编写代码：我可以编写和解释各种编程语言的代码，如Python、Java、C++等等。\n6. 提供建议：我可以提供各种生活、工作、学习等方面的建议和指导。\n\n总之，我的技能非常广泛，只要你需要，我都可以尽力帮助你。"
        }
      }
    ]
  },
  "usage": {
    "total_tokens": 206,
    "output_tokens": 163,
    "input_tokens": 43
  },
  "request_id": "7c55191a-6047-96d7-b068-e83bb0bc73ca"
}

流式输出

大模型并不是一次性生成最终结果，而是逐步地生成中间结果，最终结果由中间结果拼接而成。使用非流式输出方式需要等待模型生成结束后再将生成的中间结果拼接后返回，而流式输出可以实时地将中间结果返回，您可以在模型进行输出的同时进行阅读，减少等待模型回复的时间。

OpenAI兼容

您可以通过OpenAI SDK或OpenAI兼容的HTTP方式调用通义千问模型，体验流式输出的功能。

Python

示例代码

from openai import OpenAI
import os

def get_response():
    client = OpenAI(
        api_key=os.getenv("DASHSCOPE_API_KEY"),
        base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    )
    completion = client.chat.completions.create(
        model="qwen2-72b-instruct",
        messages=[{'role': 'system', 'content': 'You are a helpful assistant.'},
                  {'role': 'user', 'content': '你是谁？'}],
        stream=True,
        # 可选，配置以后会在流式输出的最后一行展示token使用信息
        stream_options={"include_usage": True}
        )
    for chunk in completion:
        print(chunk.model_dump_json())

if __name__ == '__main__':
    get_response()

返回结果

{"id":"chatcmpl-a53dd104-38fc-998b-8d27-cc79d3b13b62","choices":[{"delta":{"content":"","function_call":null,"role":"assistant","tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721644687,"model":"qwen2-72b-instruct","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-a53dd104-38fc-998b-8d27-cc79d3b13b62","choices":[{"delta":{"content":"我是","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721644687,"model":"qwen2-72b-instruct","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-a53dd104-38fc-998b-8d27-cc79d3b13b62","choices":[{"delta":{"content":"阿里","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721644687,"model":"qwen2-72b-instruct","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-a53dd104-38fc-998b-8d27-cc79d3b13b62","choices":[{"delta":{"content":"云","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721644687,"model":"qwen2-72b-instruct","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-a53dd104-38fc-998b-8d27-cc79d3b13b62","choices":[{"delta":{"content":"开发的一款超大规模语言","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721644687,"model":"qwen2-72b-instruct","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-a53dd104-38fc-998b-8d27-cc79d3b13b62","choices":[{"delta":{"content":"模型，我叫通义千问","function_call":null,"role":null,"tool_calls":null},"finish_reason":null,"index":0,"logprobs":null}],"created":1721644687,"model":"qwen2-72b-instruct","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-a53dd104-38fc-998b-8d27-cc79d3b13b62","choices":[{"delta":{"content":"。","function_call":null,"role":null,"tool_calls":null},"finish_reason":"stop","index":0,"logprobs":null}],"created":1721644687,"model":"qwen2-72b-instruct","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":null}
{"id":"chatcmpl-a53dd104-38fc-998b-8d27-cc79d3b13b62","choices":[],"created":1721644687,"model":"qwen2-72b-instruct","object":"chat.completion.chunk","service_tier":null,"system_fingerprint":null,"usage":{"completion_tokens":17,"prompt_tokens":22,"total_tokens":39}}

curl

示例代码

curl --location "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--data '{
    "model": "qwen2-72b-instruct",
    "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant."
        },
        {
            "role": "user", 
            "content": "你是谁？"
        }
    ],
    "stream":true
}'

返回结果

data: {"choices":[{"delta":{"content":"","role":"assistant"},"index":0,"logprobs":null,"finish_reason":null}],"object":"chat.completion.chunk","usage":null,"created":1721644713,"system_fingerprint":null,"model":"qwen2-72b-instruct","id":"chatcmpl-4d54b51f-6896-93b2-a81b-07b88304ffc4"}

data: {"choices":[{"finish_reason":null,"delta":{"content":"我是"},"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1721644713,"system_fingerprint":null,"model":"qwen2-72b-instruct","id":"chatcmpl-4d54b51f-6896-93b2-a81b-07b88304ffc4"}

data: {"choices":[{"delta":{"content":"阿里"},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1721644713,"system_fingerprint":null,"model":"qwen2-72b-instruct","id":"chatcmpl-4d54b51f-6896-93b2-a81b-07b88304ffc4"}

data: {"choices":[{"delta":{"content":"云"},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1721644713,"system_fingerprint":null,"model":"qwen2-72b-instruct","id":"chatcmpl-4d54b51f-6896-93b2-a81b-07b88304ffc4"}

data: {"choices":[{"delta":{"content":"开发的一款超大规模语言"},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1721644713,"system_fingerprint":null,"model":"qwen2-72b-instruct","id":"chatcmpl-4d54b51f-6896-93b2-a81b-07b88304ffc4"}

data: {"choices":[{"delta":{"content":"模型，我叫通义千问"},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1721644713,"system_fingerprint":null,"model":"qwen2-72b-instruct","id":"chatcmpl-4d54b51f-6896-93b2-a81b-07b88304ffc4"}

data: {"choices":[{"delta":{"content":"。"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion.chunk","usage":null,"created":1721644713,"system_fingerprint":null,"model":"qwen2-72b-instruct","id":"chatcmpl-4d54b51f-6896-93b2-a81b-07b88304ffc4"}

data: [DONE]

DashScope

您可以通过DashScope SDK或HTTP方式调用通义千问模型，体验流式输出的功能。

Python

示例代码

from http import HTTPStatus
from dashscope import Generation


def call_with_stream():
    messages = [
        {'role':'system','content':'you are a helpful assistant'},
        {'role': 'user','content': '你是谁？'}
        ]
    responses = Generation.call(
        model="qwen2-72b-instruct",
        messages=messages,
        # 设置输出为'message'格式
        result_format='message',
        # 设置输出方式为流式输出
        stream=True,
        # 增量式流式输出
        incremental_output=True
        )
    full_content = ""
    for response in responses:
        if response.status_code == HTTPStatus.OK:
            print(response)
            full_content += response.output.choices[0].message.content
        else:
            print('Request id: %s, Status code: %s, error code: %s, error message: %s' % (
                response.request_id, response.status_code,
                response.code, response.message
            ))
    print(f"Full content:{full_content}")

if __name__ == '__main__':
    call_with_stream()

返回结果

{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "我是"}}]}, "usage": {"input_tokens": 21, "output_tokens": 1, "total_tokens": 22}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "通"}}]}, "usage": {"input_tokens": 21, "output_tokens": 2, "total_tokens": 23}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "义"}}]}, "usage": {"input_tokens": 21, "output_tokens": 3, "total_tokens": 24}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "千问，由阿里"}}]}, "usage": {"input_tokens": 21, "output_tokens": 8, "total_tokens": 29}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "云开发的AI助手。我被"}}]}, "usage": {"input_tokens": 21, "output_tokens": 16, "total_tokens": 37}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "设计用来回答各种问题、提供信息"}}]}, "usage": {"input_tokens": 21, "output_tokens": 24, "total_tokens": 45}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "null", "message": {"role": "assistant", "content": "和与用户进行对话。有什么我可以"}}]}, "usage": {"input_tokens": 21, "output_tokens": 32, "total_tokens": 53}}
{"status_code": 200, "request_id": "xxx", "code": "", "message": "", "output": {"text": null, "finish_reason": null, "choices": [{"finish_reason": "stop", "message": {"role": "assistant", "content": "帮助你的吗？"}}]}, "usage": {"input_tokens": 21, "output_tokens": 36, "total_tokens": 57}}

Java

示例代码

// Copyright (c) Alibaba, Inc. and its affiliates.

import java.util.Arrays;
import java.util.concurrent.Semaphore;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.util.concurrent.Semaphore;
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.ResultCallback;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.utils.JsonUtils;
import io.reactivex.Flowable;

public class Main {

    private static final Logger logger = LoggerFactory.getLogger(Main.class);

    private static void handleGenerationResult(GenerationResult message, StringBuilder fullContent) {
        fullContent.append(message.getOutput().getChoices().get(0).getMessage().getContent());
        logger.info("Received message: {}", JsonUtils.toJson(message));
    }

    public static void streamCallWithMessage(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException {
        GenerationParam param = buildGenerationParam(userMsg);
        Flowable<GenerationResult> result = gen.streamCall(param);
        StringBuilder fullContent = new StringBuilder();

        result.blockingForEach(message -> handleGenerationResult(message, fullContent));

        logger.info("Full content: \n{}", fullContent.toString());
    }

    public static void streamCallWithCallback(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException, InterruptedException {
        GenerationParam param = buildGenerationParam(userMsg);
        Semaphore semaphore = new Semaphore(0);
        StringBuilder fullContent = new StringBuilder();

        gen.streamCall(param, new ResultCallback<GenerationResult>() {
            @Override
            public void onEvent(GenerationResult message) {
                handleGenerationResult(message, fullContent);
            }

            @Override
            public void onError(Exception err) {
                logger.error("Exception occurred: {}", err.getMessage());
                semaphore.release();
            }

            @Override
            public void onComplete() {
                logger.info("Completed");
                semaphore.release();
            }
        });

        semaphore.acquire();
        logger.info("Full content: \n{}", fullContent.toString());
    }

    private static GenerationParam buildGenerationParam(Message userMsg) {
        return GenerationParam.builder()
                .model("qwen2-72b-instruct")
                .messages(Arrays.asList(userMsg))
                .resultFormat(GenerationParam.ResultFormat.MESSAGE)
                .topP(0.8)
                .incrementalOutput(true)
                .build();
    }

    public static void main(String[] args) {
        try {
            Generation gen = new Generation();
            Message userMsg = Message.builder().role(Role.USER.getValue()).content("如何做西红柿炖牛腩？").build();

            streamCallWithMessage(gen, userMsg);
            streamCallWithCallback(gen, userMsg);
        } catch (ApiException | NoApiKeyException | InputRequiredException | InterruptedException e) {
            logger.error("An exception occurred: {}", e.getMessage());
        }
    }
}

返回结果

{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":1,"total_tokens":12},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"我是"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":2,"total_tokens":13},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"通"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":3,"total_tokens":14},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"义"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":8,"total_tokens":19},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"千问，由阿里"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":16,"total_tokens":27},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"云开发的AI助手。我被"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":24,"total_tokens":35},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"设计用来回答各种问题、提供信息"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":32,"total_tokens":43},"output":{"choices":[{"finish_reason":"null","message":{"role":"assistant","content":"和与用户进行对话。有什么我可以"}}]}}
{"requestId":"xxx","usage":{"input_tokens":11,"output_tokens":36,"total_tokens":47},"output":{"choices":[{"finish_reason":"stop","message":{"role":"assistant","content":"帮助你的吗？"}}]}}

curl

示例代码

curl --location "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--header "X-DashScope-SSE: enable" \
--data '{
    "model": "qwen2-72b-instruct",
    "input":{
        "messages":[      
            {
                "role": "system",
                "content": "You are a helpful assistant."
            },
            {
                "role": "user",
                "content": "你是谁？"
            }
        ]
    },
    "parameters": {
        "result_format": "message",
        "incremental_output":true
    }
}'

返回结果

id:1
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"我是","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":23,"input_tokens":22,"output_tokens":1},"request_id":"xxx"}

id:2
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"通","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":24,"input_tokens":22,"output_tokens":2},"request_id":"xxx"}

id:3
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"义","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":25,"input_tokens":22,"output_tokens":3},"request_id":"xxx"}

id:4
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"千问，由阿里","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":30,"input_tokens":22,"output_tokens":8},"request_id":"xxx"}

id:5
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"云开发的AI助手。我被","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":38,"input_tokens":22,"output_tokens":16},"request_id":"xxx"}

id:6
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"设计用来回答各种问题、提供信息","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":46,"input_tokens":22,"output_tokens":24},"request_id":"xxx"}

id:7
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"和与用户进行对话。有什么我可以","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":54,"input_tokens":22,"output_tokens":32},"request_id":"xxx"}

id:8
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"帮助你的吗？","role":"assistant"},"finish_reason":"stop"}]},"usage":{"total_tokens":58,"input_tokens":22,"output_tokens":36},"request_id":"xxx"}

输入与输出参数

您可以通过下表查看不同调用方式的输入参数与输出参数。其中，数据类型列中各字段的含义如下所示：

string：字符串类型。
array：在Python中表示列表，在Java中表示ArrayList。
integer：表示整数型。
float：浮点型。
boolean：布尔型。
object：哈希表。

OpenAI Python SDK

输入参数

参数	类型	默认值	说明
model	string	-	用户使用model参数指明对应的模型。请参考模型概览。
messages	array	-	用户与模型的对话历史。array中的每个元素形式为`{"role":角色, "content": 内容}`。角色当前可选值：system、user、assistant，其中，仅`messages[0]`中支持role为system，一般情况下，user和assistant需要交替出现，且messages中最后一个元素的role必须为user。
`top_p`（可选）	float	-	生成过程中的核采样方法概率阈值，例如，取值为0.8时，仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的确定性越高。
temperature（可选）	float	-	用于控制模型回复的随机性和多样性。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围： [0, 2)，不建议取值为0，无意义。
presence_penalty （可选）	float	-	用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度，取值范围[-2.0, 2.0]。重要目前仅在千问商业模型和qwen1.5及以后的开源模型上支持该参数。
max_tokens（可选）	integer	-	指定模型可生成的最大token个数。根据模型不同有不同的上限限制，一般不超过2000。
seed（可选）	integer	-	生成时使用的随机数种子，用于控制模型生成内容的随机性。seed支持无符号64位整数。
stream（可选）	boolean	False	用于控制是否使用流式输出。当以stream模式输出结果时，接口返回结果为generator，需要通过迭代获取结果，每次输出为当前生成的增量序列。
stop（可选）	string or array	None	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。以下为stop为array时的示例（tokenizer对应模型为qwen-turbo）： 1.元素为token_id： token_id为108386和104307分别对应token为“你好”和“天气”，设定stop为`[108386,104307]`，则模型将要生成“你好”或者“天气”时停止。 2.元素为字符串：设定stop为`["你好","天气"]`，则模型将要生成“你好”或者“天气”时停止。 3.元素为array： token_id为108386和103924分别对应token为“你好”和“啊”，token_id为35946和101243分别对应token为“我”和“很好”。设定stop为`[[108386, 103924],[35946, 101243]]`，则模型将要生成“你好啊”或者“我很好”时停止。说明 stop为array类型时，不可以将token_id和字符串同时作为元素输入，比如不可以指定stop为`["你好",104307]`。qwen-vl相关模型目前不支持该参数。
tools（可选）	array	None	用于指定可供模型调用的工具库，一次function call流程模型会从中选择其中一个工具。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。如果parameters参数为空，表示function没有入参。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。当前支持的模型包括qwen-turbo、qwen-plus、qwen-max和qwen-max-longcontext。说明 tools暂时无法与stream=True同时使用。qwen-vl相关模型目前不支持该参数。
stream_options（可选）	object	None	该参数用于配置在流式输出时是否展示使用的token数目。只有当stream为True的时候该参数才会激活生效。若您需要统计流式输出模式下的token数目，可将该参数配置为`stream_options={"include_usage":True}`。
enable_search (可选，通过extra_body配置）	boolean	False	用于控制模型在生成文本时是否使用互联网搜索结果进行参考。取值如下： True：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑判断是否使用互联网搜索结果。 False（默认）：关闭互联网搜索。配置方式为：`extra_body={"enable_search":True}`

出参描述

返回参数	数据类型	说明	备注
id	string	系统生成的标识本次调用的id。	无
model	string	本次调用的模型名。	无
system_fingerprint	string	模型运行时使用的配置版本，当前暂时不支持，返回为空字符串“”。	无
choices	array	模型生成内容的详情。	无
choices[i].finish_reason	string	有三种情况：正在生成时为null；因触发输入参数中的stop条件而结束为stop；因生成长度过长而结束为length。
choices[i].message	object	模型输出的消息。
choices[i].message.role	string	模型的角色，固定为assistant。
choices[i].message.content	string	模型生成的文本。
choices[i].index	integer	生成的结果序列编号，默认为0。
created	integer	当前生成结果的时间戳（s）。	无
usage	object	计量信息，表示本次请求所消耗的token数据。	无
usage.prompt_tokens	integer	用户输入文本转换成token后的长度。	您可以参考字符串与token之间的互相转换进行token的估计。
usage.completion_tokens	integer	模型生成回复转换为token后的长度。	无
usage.total_tokens	integer	usage.prompt_tokens与usage.completion_tokens的总和。	无

OpenAI兼容HTTP

输入参数

传参方式	参数	类型	默认值	说明
Header	Authorization	string	-	API-KEY，例如：Bearer d1**2a
Header	Content-Type	string	-	请求类型，例如：application/json
Body	model	string	-	用户使用model参数指明对应的模型。请参考模型概览。
	messages	array	-	用户与模型的对话历史。array中的每个元素形式为`{"role":角色, "content": 内容}`。角色当前可选值：system、user、assistant，其中，仅`messages[0]`中支持role为system，一般情况下，user和assistant需要交替出现，且messages中最后一个元素的role必须为user。
	`top_p`（可选）	float	-	生成过程中的核采样方法概率阈值，例如，取值为0.8时，仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的确定性越高。
	temperature（可选）	float	-	用于控制模型回复的随机性和多样性。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围： [0, 2)，不建议取值为0，无意义。
	presence_penalty （可选）	float	-	用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度，取值范围[-2.0, 2.0]。重要目前仅在千问商业模型和qwen1.5及以后的开源模型上支持该参数。
	max_tokens（可选）	integer	-	指定模型可生成的最大token个数。根据模型不同有不同的上限限制，一般不超过2000。
	seed（可选）	integer	-	生成时使用的随机数种子，用于控制模型生成内容的随机性。seed支持无符号64位整数。
	stream（可选）	boolean	False	用于控制是否使用流式输出。当以stream模式输出结果时，接口返回结果为generator，需要通过迭代获取结果，每次输出为当前生成的增量序列。
	stop（可选）	string or array	None	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。以下为stop为array时的示例（tokenizer对应模型为qwen-turbo）： 1.元素为token_id： token_id为108386和104307分别对应token为“你好”和“天气”，设定stop为`[108386,104307]`，则模型将要生成“你好”或者“天气”时停止。 2.元素为字符串：设定stop为`["你好","天气"]`，则模型将要生成“你好”或者“天气”时停止。 3.元素为array： token_id为108386和103924分别对应token为“你好”和“啊”，token_id为35946和101243分别对应token为“我”和“很好”。设定stop为`[[108386, 103924],[35946, 101243]]`，则模型将要生成“你好啊”或者“我很好”时停止。说明 stop为array类型时，不可以将token_id和字符串同时作为元素输入，比如不可以指定stop为`["你好",104307]`。qwen-vl相关模型目前不支持该参数。
	tools（可选）	array	None	用于指定可供模型调用的工具库，一次function call流程模型会从中选择其中一个工具。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。如果parameters参数为空，表示function没有入参。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。说明 tools暂时无法与stream=True同时使用。qwen-vl相关模型目前不支持该参数。
	stream_options（可选）	object	None	该参数用于配置在流式输出时是否展示使用的token数目。只有当stream为True的时候该参数才会激活生效。若您需要统计流式输出模式下的token数目，可将该参数配置为`stream_options={"include_usage":True}`。
	enable_search (可选，通过extra_body配置）	boolean	False	用于控制模型在生成文本时是否使用互联网搜索结果进行参考。取值如下： True：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑判断是否使用互联网搜索结果。 False（默认）：关闭互联网搜索。配置方式为：`extra_body={"enable_search":True}`

出参描述

返回参数	数据类型	说明	备注
id	string	系统生成的标识本次调用的id。	无
model	string	本次调用的模型名。	无
system_fingerprint	string	模型运行时使用的配置版本，当前暂时不支持，返回为空字符串“”。	无
choices	array	模型生成内容的详情。	无
choices[i].finish_reason	string	有三种情况：正在生成时为null；因触发输入参数中的stop条件而结束为stop；因生成长度过长而结束为length。
choices[i].message	object	模型输出的消息。
choices[i].message.role	string	模型的角色，固定为assistant。
choices[i].message.content	string	模型生成的文本。
choices[i].index	integer	生成的结果序列编号，默认为0。
created	integer	当前生成结果的时间戳（s）。	无
usage	object	计量信息，表示本次请求所消耗的token数据。	无
usage.prompt_tokens	integer	用户输入文本转换成token后的长度。	您可以参考字符串与token之间的互相转换进行token的估计。
usage.completion_tokens	integer	模型生成回复转换为token后的长度。	无
usage.total_tokens	integer	usage.prompt_tokens与usage.completion_tokens的总和。	无

DashScope SDK

输入参数

参数	数据类型	默认值	说明
model（必选）	string	无	指定用于对话的通义千问模型名。请参考模型概览。
messages	array	无	`messages`：用户与模型的对话历史。array中的每个元素形式为`{"role":角色, "content": 内容}`，角色当前可选值：`system`、`user`、`assistant`和`tool`。 `system`：表示系统级消息，用于指导模型按照预设的规范、角色或情境进行回应。是否使用`system`角色是可选的，如果使用则必须位于messages的最开始部分。 `user`和`assistant`：表示用户和模型的消息。它们应交替出现在对话中，模拟实际对话流程。 `tool`：表示工具的消息。在使用function call功能时，如果要传入工具的结果，需将元素的形式设为{"content":"工具返回的结果", "name":"工具的函数名", "role":"tool"}。其中name是工具函数的名称，需要和上轮response中的tool_calls[i]['function']['name']参数保持一致；content是工具函数的输出。 `prompt`：用户输入的指令，用于指导模型生成回复。说明 messages和prompt任选一个参数使用即可。由于和prompt组合使用的对话历史参数history即将废弃，仅依赖prompt指令会限制模型进行有记忆的对话能力。 messages参数允许模型参考历史对话，从而更准确地解析用户的意图，确保对话的流程性和连续性，因此在多轮对话场景下推荐您优先使用messages参数。
prompt	string	无（与messages不可同时为空）
seed（可选）	integer		生成时使用的随机数种子，用于控制模型生成内容的随机性。seed支持无符号64位整数。
max_tokens（可选）说明 Java SDK中为maxTokens。	integer		指定模型可生成的最大token个数。
top_p（可选）说明 Java SDK中为topP。	float		生成过程中的核采样方法概率阈值，例如，取值为0.8时，仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的确定性越高。
top_k（可选）说明 Java SDK中为topK。	integer		生成时，采样候选集的大小。例如，取值为50时，仅将单次生成中得分最高的50个token组成随机采样的候选集。取值越大，生成的随机性越高；取值越小，生成的确定性越高。取值为None或当top_k大于100时，表示不启用top_k策略，此时，仅有top_p策略生效。
repetition_penalty（可选）说明 Java SDK中为repetitionPenalty。	float		用于控制模型生成时连续序列中的重复度。提高repetition_penalty时可以降低模型生成的重复度，1.0表示不做惩罚。没有严格的取值范围。
presence_penalty（可选）说明 Java SDK中暂不支持该参数。	float		用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度，取值范围[-2.0, 2.0]。
temperature（可选）	float		用于控制模型回复的随机性和多样性。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围：[0, 2)，不建议取值为0，无意义。
stop (可选）	string or array	None	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。以下为stop为array时的示例（tokenizer对应模型为qwen-turbo）： 1.元素为token_id： token_id为108386和104307分别对应token为“你好”和“天气”，设定stop为`[108386,104307]`，则模型将要生成“你好”或者“天气”时停止。 2.元素为字符串：设定stop为`["你好","天气"]`，则模型将要生成“你好”或者“天气”时停止。 3.元素为array： token_id为108386和103924分别对应token为“你好”和“啊”，token_id为35946和101243分别对应token为“我”和“很好”。设定stop为`[[108386, 103924],[35946, 101243]]`，则模型将要生成“你好啊”或者“我很好”时停止。说明 stop为array类型时，不可以将token_id和字符串同时作为元素输入，比如不可以指定stop为`["你好",104307]`。
stream (可选）	boolean	False	用于控制是否使用流式输出。当以stream模式输出结果时，接口返回结果为generator，需要通过迭代获取结果，默认每次输出为当前生成的整个序列，最后一次输出为最终全部生成结果，可以通过设置参数incremental_output为False改变输出模式为非增量输出。
enable_search（可选）说明 Java SDK中为enableSearch	boolean	False	用于控制模型在生成文本时是否使用互联网搜索结果进行参考。取值如下： True：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑判断是否使用互联网搜索结果。 False（默认）：关闭互联网搜索。
result_format（可选）说明 Java SDK中为resultFormat。	string	text	用于指定返回结果的格式，默认为text，也可选择message。推荐您优先使用message格式。
incremental_output (可选）说明 Java SDK中为incrementalOutput。	boolean	False	控制在流式输出模式下是否开启增量输出，即后续输出内容是否包含已输出的内容。设置为True时，将开启增量输出模式，后面输出不会包含已经输出的内容，您需要自行拼接整体输出；设置为False则会包含已输出的内容。默认False： I I like I like apple True: I like apple 该参数只能在stream为True时使用。说明 incremental_output暂时无法和tools参数同时使用。
tools	array	None	用于指定可供模型调用的工具库，一次function call流程模型会从中选择其中一个工具。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。如果parameters参数为空，表示function没有入参。使用tools时需要同时指定result_format为message。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。说明 tools暂时无法和incremental_output参数同时使用。

返回结果

当result_format设置为message时，返回结果示例如下：

{
    "status_code": 200,
    "request_id": "b3d8bb75-05a2-9044-8e9e-ec8c87689a5e",
    "code": "",
    "message": "",
    "output": {
        "text": null,
        "finish_reason": null,
        "choices": [
            {
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": "材料：\n- 萝卜：2根\n- 土豆：2个\n- 茄子：2个\n- 大葱：1根\n- 姜：适量\n- 蒜：适量\n- 食用油：适量\n- 盐：适量\n- 生抽：适量\n- 蚝油：适量\n\n做法：\n\n1. 将萝卜、土豆、茄子分别洗净去皮，切成块状备用。\n2. 大葱切断，姜切片，蒜切末备用。\n3. 烧热锅，加入适量的食用油，放入葱段、姜片、蒜末爆香。\n4. 加入萝卜块，翻炒几分钟，加入适量的盐、生抽调味。\n5. 加入土豆块，继续翻炒几分钟，加入适量的盐、生抽调味。\n6. 加入茄子块，继续翻炒几分钟，加入适量的盐、生抽调味。\n7. 加入适量的蚝油，翻炒均匀，让每一块蔬菜都均匀地裹上蚝油。\n8. 翻炒几分钟，让蔬菜熟透，即可出锅。\n\n这道菜色香味俱佳，营养丰富，可以作为主食或配菜食用。"
                }
            }
        ]
    },
    "usage": {
        "input_tokens": 31,
        "output_tokens": 267
    }
}

当result_format设置为text时，返回结果示例如下：

{
    "status_code": 200,
    "request_id": "446877aa-dbb8-99ca-98eb-d78a5e90fe61",
    "code": "",
    "message": "",
    "output": {
        "text": "材料：\n- 萝卜：2根\n- 土豆：2个\n- 茄子：2个\n- 大葱：1根\n- 姜：适量\n- 蒜：适量\n- 食用油：适量\n- 盐：适量\n- 生抽：适量\n- 蚝油：适量\n\n做法：\n\n1. 将萝卜、土豆、茄子分别洗净去皮，切成块状备用。\n2. 大葱切段，姜切片，蒜切末备用。\n3. 烧热锅，加入适量的食用油，放入葱段、姜片、蒜末爆香。\n4. 加入萝卜块，翻炒几分钟，加入适量的盐、生抽调味。\n5. 加入土豆块，继续翻炒几分钟，加入适量的盐、生抽调味。\n6. 加入茄子块，继续翻炒几分钟，加入适量的盐、生抽调味。\n7. 加入适量的蚝油，翻炒均匀，让每一块蔬菜都均匀地裹上蚝油。\n8. 翻炒几分钟，让蔬菜熟透，即可出锅。\n\n这道菜色香味俱佳，营养丰富，可以作为主食或配菜食用。",
        "finish_reason": "stop",
        "choices": null
    },
    "usage": {
        "input_tokens": 31,
        "output_tokens": 267
    }
}

出参描述

参数	类型	说明
status_code	int	200（HTTPStatus.OK）表示请求成功，否则表示请求失败，可以通过code获取错误码，通过message字段获取错误详细信息。
request_Id	string	系统生成的标志本次调用的ID。
code	string	表示请求失败，表示错误码，成功忽略。
message	string	失败，表示失败详细信息，成功忽略。
output	dict	调用结果信息，对于千问模型，包含输出text。
output.usage	dict	计量信息，表示本次请求的计量数据。
output.text	string	模型生成回复。
output.finish_reason	string	包括以下三种情况： null：正在生成 stop：生成结束时，停止token。 length：生成结束时，生成长度过长。
usage.input_tokens	int	用户输入文本转换成Token后的长度。
usage.output_tokens	int	模型生成回复转换为Token后的长度。
choices	List	[]
choices[i].finish_reason	string	包括以下三种情况： null：正在生成 stop：生成结束时，停止token。 length：生成结束时，生成长度过长。
choices[i].message	dict	模型生成消息输出。
message.role	string	模型role，固定为assistant。
message.content	string	模型生成的文本。

DashScope HTTP

输入参数

传参方式	字段	数据类型	必选	描述	示例值
Header	Content-Type	string	是	请求类型：application/json	"Content-Type":"application/json"
	Accept	string	否	选择text/event-stream则会开启SSE响应，默认无设置。	"Accept":"text/event-stream"
	Authorization	string	是	API-KEY，例如：Bearer d1**2a	"Authorization":"Bearer d1**2a"
	X-DashScope-WorkSpace	string	否	指明本次调用需要使用的workspace；需要注意的是，对于子账号Apikey调用，此参数为必选项，子账号必须归属于某个workspace才能调用；对于主账号Apikey此项为可选项，添加则使用对应的workspace身份，不添加则使用主账号身份。	ws_QTggmeAxxxxx
	X-DashScope-SSE	string	否	设置为enable或者设置Accept: text/event-stream即可启用SSE响应。	"X-DashScope-SSE":"enable"
Body	model	string	是	指定用于对话的通义千问模型名。请参考模型概览。	"model":"qwen-turbo"
	input	object	是	输入模型的信息。	无
	input.prompt 说明字段中的点号（.）表示后者为前者的属性。在API测试工具中，并不能直接将Key设置为input.prompt。传入方式为"input":{"prompt":"xxx"}。	string	否	用户当前输入的期望模型执行指令，支持中英文。与input.messages指定其中一个即可。	"input":{"prompt":"你好"}
	input.history	array	否	即将废弃，请使用messages字段。用户与模型的对话历史，array中的每个元素形式为{"user":"用户输入","bot":"模型输出"}的一轮对话，多轮对话按时间正序排列。	"input":{"history":[{"user":"今天天气好吗？", "bot":"今天天气不错，要出去玩玩嘛？"}, {"user":"那你有什么地方推荐？", "bot":"我建议你去公园，春天来了，花朵开了，很美丽。"}]}
	input.messages	array	否	表示用户与模型的对话历史。array中的每个元素形式为`{"role":角色, "content": 内容}`，如果role为tool，元素形式为： `{"role":"tool","content":内容,"name":工具函数名}` 角色可选值：`system`、`user`、`assistant`和`tool`。	"input":{ "messages":[ { "role": "system", "content": "You are a helpful assistant." }, { "role": "user", "content": "你好，附近哪里有博物馆？" }] }
	input.messages.role	string	messages存在的时候不能省略。
	input.messages.content	string	messages存在的时候不能省略。
	input.messages.name	string	input.messages.role为tool时不能省略	role为`tool`表示当前message为function_call的调用结果，name是工具函数名，需要和上轮response中的tool_calls[i].function.name参数保持一致，content为工具函数的输出。
	parameters	object	否	用于控制模型生成的参数	无
	parameters.result_format	string	否	用于指定返回结果的格式，默认为text，也可设置为message。推荐优先使用message格式。	"parameters":{"result_format":"message"}
	parameters.seed	integer	否	生成时使用的随机数种子，用户控制模型生成内容的随机性。seed支持无符号64位整数。在使用seed时，模型将尽可能生成相同或相似的结果，但目前不保证每次生成的结果完全相同。	"parameters":{"seed":666}
	parameters.max_tokens	integer	否	用于限制模型生成token的数量，表示生成token个数的上限。	"parameters":{"max_tokens":1500}
	parameters.top_p	float	否	生成时，核采样方法的概率阈值。例如，取值为0.8时，仅保留累计概率之和大于等于0.8的概率分布中的token，作为随机采样的候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的随机性越低。注意，取值不要大于等于1。	"parameters":{"top_p":0.7}
	parameters.top_k	integer	否	生成时，采样候选集的大小。例如，取值为50时，仅将单次生成中得分最高的50个token组成随机采样的候选集。取值越大，生成的随机性越高；取值越小，生成的确定性越高。注意：如果top_k参数为空或者top_k的值大于100，表示不启用top_k策略，此时仅有top_p策略生效。	"parameters":{"top_k":50}
	parameters.repetition_penalty	float	否	用于控制模型生成时连续序列中的重复度。提高repetition_penalty时可以降低模型生成的重复度。1.0表示不做惩罚。没有严格的取值范围。	"parameters":{"repetition_penalty":1.0}
	parameters.presence_penalty	float	否	用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度，取值范围 [-2.0, 2.0]。	"parameters":{"presence_penalty":1.0}
	parameters.temperature	float	否	用于控制随机性和多样性的程度。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围：[0, 2)，不建议取值为0，无意义。	"parameters":{"temperature":0.85}
	parameters.stop	string/array	否	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止，生成的内容不包含指定的内容。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。例如将stop指定为`["你好","天气"]`或者`[108386,104307]`，则模型将要生成“你好”或者“天气”时停止。如果将stop指定为`[[108386, 103924],[35946, 101243]]`，则模型将要生成“你好啊”或者“我很好”时停止。说明 stop为array类型时，不可以将token_id和字符串同时作为元素输入，比如不可以指定stop为`["你好",104307]`。	"parameters":{"stop":["你好","天气"]}
	parameters.enable_search	boolean	否	模型内置了互联网搜索服务，该参数控制模型在生成文本时是否参考使用互联网搜索结果。取值如下： true：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑“自行判断”是否使用互联网搜索结果。 false（默认）：关闭互联网搜索。	"parameters":{"enable_search":false}
	parameters.incremental_output	boolean	否	控制在流式输出模式下是否开启增量输出，即后续输出内容是否包含已输出的内容。设置为True时，将开启增量输出模式，后面输出不会包含已经输出的内容，您需要自行拼接整体输出；设置为False则会包含已输出的内容。默认False： I I like I like apple True: I like apple 该参数只能在开启SSE响应时使用。说明 incremental_output暂时无法和tools参数同时使用。	"parameters":{"incremental_output":false}
	parameters.tools	array	否	用于指定可供模型调用的工具列表。当输入多个工具时，模型会选择其中一个生成结果。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。使用tools时需要同时指定result_format为message。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。说明 tools暂时无法和incremental_output参数同时使用。	`"parameters":{"tools":[ { "type": "function", "function": { "name": "get_current_weather", "description": "Get the current weather in a given location", "parameters": { "type": "object", "properties": { "location": { "type": "string", "description": "The city and state, e.g. San Francisco, CA" }, "unit": { "type": "string", "enum": [ "celsius", "fahrenheit" ] } }, "required": [ "location" ] } } } ]}`

出参描述

字段	数据类型	描述	示例值
output.text	string	模型输出的内容。当result_format设置为text时返回该字段。	我建议你去颐和园
output.finish_reason	string	有三种情况：正在生成时为null，生成结束时如果由于停止token导致则为stop，生成结束时如果因为生成长度过长导致则为length。当result_format设置为text时返回该字段。	stop
output.choices	array	当result_format设置为message时返回该字段。	普通示例 `{ "choices": [ { "finish_reason": "null", "message": { "role": "assistant", "content": "周围的咖啡馆在..." } } ] }` function call示例 `{ "choices": [ { "finish_reason": "tool_calls", "message": { "role": "assistant", "content": "", "tool_calls": [ { "function": { "name": "get_current_weather", "arguments": "{\"location\": \"Boston\", \"unit\": \"fahrenheit\"}" }, "type": "function" } ] } } ] }`
output.choices[x].finish_reason	string	停止原因，null：生成过程中 stop：stop token导致结束 length：生成长度导致结束
output.choices[x].message	object	message每个元素形式为{"role":角色, "content": 内容}。角色可选值：`system`、`user`、`assistant`。content为模型输出的内容。
output.choices[x].message.role	string
output.choices[x].message.content	string
output.choices[x].message.tool_calls	object	如果模型需要调用工具，则会生成tool_calls参数，应用于function_call场景。其中包含type和function两个参数，参数详情如下： type，类型为string，当前只可能为function function，类型为dict，包含name和arguments两个参数： name，类型为string，表示需要调用的工具的名称，如果是function_call场景则表示要调用的function名称 arguments，类型为string，表示模型生成的工具入参，在Python中可以使用json.loads方法转化为字典类型。
usage	object	本次调用使用的token信息。	无
usage.output_tokens	integer	模型输出内容的 token个数。	380
usage.input_tokens	integer	本次请求输入内容的token个数。在enable_search设置为true时，输入的 token 数目由于需要添加搜索相关内容，因此会比您在请求中的输入token个数多。	633
usage.total_tokens	integer	usage.output_tokens与usage.input_tokens的总和。	1013
request_id	string	本次请求的系统唯一码。	7574ee8f-38a3-4b1e-9280-11c33ab46e51

异常响应示例

此处以未传入正确API-KEY为例，向您展示异常响应的示例。

OpenAI SDK

openai.AuthenticationError: Error code: 401 - {'error': {'message': 'Incorrect API key provided. ', 'type': 'invalid_request_error', 'param': None, 'code': 'invalid_api_key'}}

OpenAI兼容-HTTP

{
    "error": {
        "message": "Incorrect API key provided. ",
        "type": "invalid_request_error",
        "param": null,
        "code": "invalid_api_key"
    }
}

DashScope SDK

Request id: 54e9e525-bd50-9a05-9442-8801800c57fd, Status code: 401, error code: InvalidApiKey, error message: Invalid API-key provided.

DashScope-HTTP

{
    "code": "InvalidApiKey",
    "message": "Invalid API-key provided.",
    "request_id": "c2b1ab6e-e5a5-9d21-8579-88a10ce39c2f"
}

状态码说明

大模型服务平台通用状态码详情，请参见状态码说明。