无论是平台的预置模型还是您调优后的模型,通过部署可获得独立的、资源专享的推理服务,以满足您对高并发、低延迟等不同性能的业务需求。
本文档仅适用于中国大陆版(北京地域)。
支持的模型
模型类别 | 支持的模型 | 适用场景 |
预置模型 (阿里云百炼支持的标准模型) |
| 获取资源实例,保障推理性能与稳定性。 |
我的模型 (阿里云百炼平台调优后的模型) | 必须部署后才能推理或评测。 |
如果需要部署更多其他模型,请参考解决方案并结合具体业务需求选择最适合的部署方案。
支持的计费方式
计费方式在服务创建后无法更改。如需切换,必须下线已经部署的模型后再重新部署。
计费方式 | 部署方式 | 支持的模型 | 扩缩容方式 | 计费最小单位 | 优点 | 产品约束 |
按使用时长 (后付费) | 模型单元 | 所有可部署模型 | 自助扩缩容 | 分钟 |
| - |
包月 (预付费) | 部分可部署模型 | 自助扩缩容 | 天 |
|
| |
按模型使用量 (后付费) | Token 用量 | 部分可部署模型 | 在控制台提交申请, 等待人工审核。 | Token |
|
|
计费详情
通义千问模型-按模型单元(时间)计费
通义千问模型-按实例(时间)计费(旧)
通义千问模型-按模型 Token 调用量计费
图片、视频生成模型(预置)-按实例(时间)计费
调用统计
部署方法
您可以在控制台上部署模型,请参考以下操作步骤:
如果提示权限不足,请参考:部署时提示权限不足怎么办?
|
|
| |
重要 模型部署服务将产生费用。 |
部署后调用
模型部署成功后,支持通过 OpenAI 兼容、DashScope、LlamaIndex、LangChain及Assistant SDK进行调用。
在调用已部署成功的模型时,model的取值应为模型部署成功后的模型code。请您前往模型部署界面获取模型 code。

示例代码以调用微调后的 qwen3-8b 模型为例:
模型特性(是否支持非流式输出、结构化输出等)与微调前的模型保持一致。
经过调优的深度思考模型在调用时是否开启深度思考,建议与调优数据格式一致:
调优数据含深度思考,调用时建议开启
enable_thinking参数。调优数据不含深度思考,调用时不建议开启
enable_thinking参数。
DashScope
import os
import dashscope
messages = [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "你是谁?"},
]
response = dashscope.Generation.call(
# 若没有配置环境变量,请用百炼API Key将下行替换为:api_key="sk-xxx",
api_key=os.getenv("DASHSCOPE_API_KEY"),
model="qwen3-8b-ft-xxx-xxx", # 请替换为模型部署成功后的code
messages=messages,
result_format="message",
enable_thinking=False,
)
print(response)
OpenAI兼容接口
import os
from openai import OpenAI
client = OpenAI(
# 若没有配置环境变量,请用百炼API Key将下行替换为:api_key="sk-xxx",
api_key=os.getenv('DASHSCOPE_API_KEY'),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
model="qwen3-8b-ft-xxx-xxx", # 请替换为模型部署成功后的code
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "你是谁?"},
],
extra_body={"enable_thinking": False},
)
print(completion)
部署服务扩缩容
按模型单元(时长)计费方式部署的模型可点击红框的扩缩容,自助、手动调节实例数量。
按调用量计费方式部署的模型点击黄框的扩容,填写并提交扩容申请表单,等待人工审核。

部署服务下线
如果不再需要模型部署服务,需要停止服务计费,请您按照此操作下线部署服务,下线后将不再产生计费:
|
|
常见问题
可以上传和部署自己的模型吗?
暂不支持上传和部署自有模型,建议您持续关注阿里云百炼最新动态。此外,阿里云人工智能平台 PAI 提供了部署自有模型的功能,您可以参考PAI模型部署与推理了解部署方法。
部署时提示权限不足怎么办?
如果显示“缺少该模块的权限”,请确保您的账号在该业务空间的权限管理页面中拥有模型部署-操作权限。

如果无法正常操作,请联系您的组织或 IT 管理员添加相关权限或代为检查权限问题。
如果部署时报错“xx业务空间没有部署xx模型的权限”,请前往百炼的业务空间管理页面,为对应业务空间添加对应模型的部署权限。
API 调用报错:
Workspace xxx does not have deployment privilege for model xxxx。

如果提示权限不足,请联系您的组织或 IT 管理员添加相关权限。
该如何切换到其他的计费方式?
只能释放原有资源,再重新使用需要的方式创建资源。
建议按照以下步骤进行切换:
使用需要的方式部署新的资源。
切换 API 并测试服务可用性。
下线释放原有资源。




