调用百炼前先选择地域、服务部署范围、接入域名:
-
地域:决定接入点和数据存储位置,就近选择可降低延迟;
-
服务部署范围:决定推理执行位置,有数据合规需求选择特定地理边界的部署范围,无合规需求选择全球部署范围(推理资源池更大);
-
接入域名:影响并发上限、超时等服务保障,各地域具有独立的接入域名。
一次完整的模型调用流程如下:
-
应用经接入域名将请求发送到所选地域(如华北2-北京),请求数据存于该地域;
-
接入地域将请求转发至服务部署范围内的推理节点完成计算(过程数据不持久化,传输全程加密);
-
推理结果回到接入地域存储,再响应给应用(用户静态数据始终存于所选地域)。
选择地域和服务部署范围
按场景查表选地域和服务部署范围:
|
使用场景 |
地域 |
服务部署范围 |
|
无数据驻留限制,追求更大推理资源池(跨多地域调度推理,自行确保跨境合法) |
美国(弗吉尼亚) |
全球(任意可用节点,含中国境内及海外) |
|
无数据驻留限制,追求更大推理资源池(跨多地域调度推理,自行确保跨境合法) |
德国(法兰克福) |
全球(任意可用节点,含中国境内及海外) |
|
无数据驻留限制,追求更大推理资源池(跨多地域调度推理,自行确保跨境合法) |
日本(东京) |
全球(任意可用节点,含中国境内及海外) |
|
要求数据不出中国内地 |
华北2(北京) |
中国内地(限境内推理) |
|
要求数据不经过中国内地(会跨多地域调度推理,自行确保跨境合法) |
新加坡 |
国际(除中国内地以外的全球节点) |
|
要求数据不出美国 |
美国(弗吉尼亚) |
美国(限境内推理) |
|
要求数据不出欧盟 |
德国(法兰克福) |
欧盟(限境内推理) |
|
要求数据不出日本 |
日本(东京) |
日本(限境内推理) |
选择接入域名
百炼为模型推理 API 提供专属、共享和试用三种接入域名,适用于从试用体验到企业级生产的不同场景。推荐使用专属域名,各域名的核心差异如下:
|
对比项 |
专属域名(推荐) |
共享域名(现有域名) |
试用域名 |
|
域名格式 |
|
以华北2(北京)地域为例 |
|
|
适用场景 |
推荐在生产环境中使用,具备更高并发承载能力与网络隔离性,保障大流量场景下的稳定、低延迟访问体验。 |
存量业务兼容,建议迁移至专属域名。 |
快速体验、功能验证,不建议用于生产环境。 |
|
鉴权方式 |
仅访问当前业务空间 |
可访问所有业务空间 |
可访问所有业务空间 |
|
限流额度 |
RPM、TPM 按模型区分 |
RPM、TPM 按模型区分 |
RPM 为1000,TPM 按模型区分 |
|
请求超时 |
3600 秒 |
600 秒 |
600 秒 |
|
协议支持 |
HTTP、SSE、WebSocket、WebRTC |
HTTP、SSE、WebSocket |
HTTP、SSE |
|
SLA |
99.9% |
99.9% |
不提供 |
各地域接入信息
每个地域有独立的接入域名、API Key 和模型列表,不能跨地域混用。
|
地域 |
地域ID |
专属域名 |
共享域名 |
试用域名 |
API Key |
模型列表 |
|
华北2(北京) |
|
|
|
|
||
|
新加坡 |
|
|
|
|
||
|
德国(法兰克福) |
|
|
不支持 |
暂不支持 |
||
|
日本(东京) |
|
|
不支持 |
暂不支持 |
||
|
美国(弗吉尼亚) |
- |
暂不支持 |
|
暂不支持 |
迁移至专属域名
从共享或试用域名迁移到专属域名只需两步,无需修改业务逻辑代码:
-
获取专属域名:
-
替换 Base URL 中的域名:将原域名替换为专属域名。以华北2(北京)地域为例,
llm-xxx为业务空间 ID:-
OpenAI 兼容接口:从
https://dashscope.aliyuncs.com/compatible-mode/v1替换为https://llm-xxx.cn-beijing.maas.aliyuncs.com/compatible-mode/v1 -
DashScope 接口:从
https://dashscope.aliyuncs.com/api/v1替换为https://llm-xxx.cn-beijing.maas.aliyuncs.com/api/v1 -
Anthropic 兼容接口:从
https://dashscope.aliyuncs.com/apps/anthropic替换为https://llm-xxx.cn-beijing.maas.aliyuncs.com/apps/anthropic
-
各地域功能支持
|
功能 |
华北2(北京) |
新加坡 |
美国(弗吉尼亚) |
德国(法兰克福) |
日本(东京) |
|
实时推理 |
|
|
|
|
|
|
批量推理 |
|
|
|
|
|
|
模型体验 |
|
|
|
|
|
|
模型监控 |
|
|
|
|
|
|
模型告警 |
|
|
|
|
|
|
传输安全 |
|
|
|
|
|
|
权限管理 |
|
|
|
|
|
|
模型调优 |
|
|
|
|
|