在使用百炼模型服务时,您需要选择两个关键配置项:
-
地域:决定模型服务的接入位置和用户静态数据的存储位置。
-
服务部署范围:决定推理计算可以在哪些区域执行。
这两个配置相互独立,但必须按预定义组合使用。它们共同影响服务的延时、成本、可用模型及默认限流。无论选择哪种服务部署范围,您的静态数据(包括输入、输出)始终存储在所选地域内。
提示:地域控制“数据存储在哪”,服务部署范围控制“推理计算在哪”。两者结合,帮助您平衡性能、成本与合规需求。
如何选择地域
模型服务的地域是指您接入百炼模型服务的物理节点位置。选择地域时,请考量以下维度:
-
访问延迟:物理距离直接影响响应速度。建议选择靠近您或您的终端用户的地域,以最小化网络延迟。
-
合规准入:业务部署须符合当地法律法规,请根据您的合规诉求选择合适您的静态数据存储位置。
当前支持的地域:华北2(北京)、美国(弗吉尼亚)、新加坡
所有用户静态数据均存储在所选地域,符合本地数据驻留要求。
服务部署范围对比
服务部署范围决定了模型推理的计算区域,地域和服务部署范围二者为预设绑定关系,不支持自由组合。
为了降低网络延迟、提升模型响应速度,建议根据您主要用户或业务应用的地理位置选择就近地域对应的服务部署范围:
|
服务部署范围 |
绑定地域(数据存储) |
模型推理计算范围 |
|
中国内地 |
华北2(北京) |
仅限中国内地 |
|
全球 |
美国(弗吉尼亚) |
全球动态调度 |
|
国际 |
新加坡 |
全球动态调度(不含中国内地) |
|
美国 |
美国(弗吉尼亚) |
仅限美国境内 |
-
全球:适用于用户遍布全球且追求模型高可用性的业务。该服务部署范围利用全球分布的计算资源,模型可用性有保障。
-
国际:适用于服务海外用户(如亚太,美国等),但由于业务策略或合规需求,需明确排除使用中国内地大陆境内计算资源的场景。
-
中国内地:适用于主要服务中国境内用户,且必须严格满足中国等境内监管要求的场景。
-
美国:适用于业务主体在美国,或受美国法规限制,需确保所有数据处理与推理行为均严格限于美国境内的场景。
在全球服务部署范围和国际服务部署范围下,由于涉及跨境计算,您需自行确保用户业务数据跨境处理的合法性。跨区推理请求由所选地域的前端接入点接收。模型调用过程中产生的静态数据(如提示词输入、模型输出等)仅在推理过程中进行瞬时处理,不会在计算节点所在地域进行持久化存储;数据在传输过程中全程加密。
如何使用
使用中国内地部署范围下的模型
使用前,请先配置请求地址、API Key和模型名称:
使用全球部署范围下的模型
使用前,请先配置请求地址、API Key和模型名称:
-
请求地址(Base URL):全球部署范围绑定美国(弗吉尼亚)地域,请使用
dashscope-us.aliyuncs.com域名。以下为部分请求地址示例,其他 API 请参考对应文档:-
OpenAI Chat Completions API :
https://dashscope-us.aliyuncs.com/compatible-mode/v1 -
DashScope:
https://dashscope-us.aliyuncs.com/api/v1
-
-
API Key:请前往密钥管理(弗吉尼亚)页面获取。
-
模型名称:请参考模型列表,选择全球部署范围的模型。
使用国际部署范围下的模型
使用前,请先配置请求地址、API Key和模型名称:
使用美国部署范围下的模型
使用前,请先配置请求地址、API Key和模型名称:
-
请求地址(Base URL):美国部署范围绑定美国(弗吉尼亚)地域,请使用
dashscope-us.aliyuncs.com域名。以下为部分请求地址示例,其他 API 请参考对应文档:-
OpenAI Chat Completions API :
https://dashscope-us.aliyuncs.com/compatible-mode/v1 -
DashScope:
https://dashscope-us.aliyuncs.com/api/v1
-
-
API Key:请前往密钥管理(弗吉尼亚)页面获取。
-
模型名称:请参考模型列表,选择美国部署范围的模型(带
-us后缀)。
异步任务
对于异步任务(如图像生成、视频生成),所有后续操作必须使用创建任务时所用的服务域名和 API Key,否则会导致报错。
以下是在全球部署范围(美国地域)下创建图像生成任务并查询结果的示例。如使用德国地域,请将服务域名替换为{WorkspaceId}.eu-central-1.maas.aliyuncs.com:
# 创建任务(全球部署范围-美国地域,服务域名dashscope-us.aliyuncs.com)
curl --location 'https://dashscope-us.aliyuncs.com/api/v1/services/aigc/image-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'X-DashScope-Async: enable' \
--data '{
"model": "wan2.6-t2i",
"input": {
"messages": [
{
"role": "user",
"content": [
{
"text": "一间有着精致窗户的花店,漂亮的木质门,摆放着花朵"
}
]
}
]
},
"parameters": {
"n": 1
}
}'
# 响应示例:{"output":{"task_id":"abc123..."},"request_id":"..."}
# 查询任务(必须使用相同服务域名)
curl -X GET https://dashscope-us.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
# [错误] 使用其他服务域名查询将导致报错
curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
各地域支持的功能
百炼在各地域提供的平台能力略有差异,但均适用于该地域下所有可用的部署范围:
|
板块 |
功能 |
华北2(北京) |
新加坡 |
美国(弗吉尼亚) |
|
使用 |
实时推理 |
|
|
|
|
批量推理 |
|
|
|
|
|
模型体验 |
|
|
|
|
|
管理 |
模型监控 |
|
|
|
|
模型告警 |
|
|
|
|
|
传输安全 |
|
|
|
|
|
权限管理 |
|
|
|
|
|
优化 |
模型调优 |
|
|
|