如何选择地域和部署模式

使用阿里云百炼的模型服务时,需正确选择地域部署模式,二者将影响模型服务的响应速度、成本、可用模型默认限流

  • 地域:决定您的模型服务接入点(Endpoint/Base URL),以及模型调用过程中产生的静态数据(如提示词输入、模型输出等)的存储位置。

  • 部署模式:决定模型推理计算的执行区域。

目前,地域与部署模式为系统预设绑定关系,不支持自由组合。

image

地域选择

选择时请考虑:

  • 就近:选择主要(或大多数)调用端近邻地域,通常可降低网络延迟,从而提升模型的响应速度。

  • 可用平台功能:阿里云百炼为不同地域提供的平台功能有差异,详见下表。

    板块

    功能

    华北2(北京)

    新加坡

    美国(弗吉尼亚)

    使用

    实时推理

    支持

    支持

    支持

    批量推理

    支持

    支持

    不支持

    模型体验

    支持

    支持

    支持

    管理

    模型监控

    支持

    支持

    支持

    模型告警

    支持

    支持

    不支持

    传输安全

    支持

    支持

    支持

    权限管理

    支持

    支持

    支持

    优化

    模型调优

    支持

    支持

    支持

支持的地域

地域名称

地域 ID

静态数据存储位置

华北2(北京)

cn-beijing

北京

新加坡

ap-southeast-1

新加坡

美国(弗吉尼亚)

us-east-1

弗吉尼亚

通过 API 或 SDK 调用模型时,需要使用与地域对应的模型服务接入点,详情请参见通义千问API参考

部署模式选择

不同部署模式支持的模型模型调用计费限流有差异。选型建议:

  • 中国内地需使用中国内地计算资源并在中国内地处理数据

  • 全球希望使用全球算力资源池,从而提升模型的可用性及默认限流。

  • 国际需使用非中国内地计算资源

  • 美国希望数据处理与推理行为均发生在美国境内

支持的部署模式

部署模式

绑定地域

模式触发条件

模型推理计算范围

是否涉及跨境计算

中国内地

华北2(北京)

选择绑定地域即可

仅限中国内地

全球

美国(弗吉尼亚)

选择绑定地域,调用不带 -us 后缀的模型

全球

是(您需自行确保用户业务数据跨境处理的合法性)

国际

新加坡

选择绑定地域即可

全球(不含中国内地)

是(您需自行确保用户业务数据跨境处理的合法性)

美国

美国(弗吉尼亚)

选择绑定地域,调用带 -us 后缀的模型

仅限美国境内

重要

全球国际模式下,跨区推理请求由所选地域的前端接入点接收。模型调用过程中产生的静态数据(如提示词输入、模型输出等)仅在推理过程中进行瞬时处理,不会在计算节点所在地域进行持久化存储;数据在传输过程中全程加密。

如何在控制台切换地域与部署模式

进入阿里云百炼控制台,点击页面右上角的image地域图标。

  • 华北2(北京):模型为中国内地部署模式。

  • 新加坡:模型为国际部署模式。

  • 美国(弗吉尼亚):您调用的模型将决定部署模式。

    • 不带 -us 后缀(如 qwen-flash):模型为全球部署模式。

    • 带 -us 后缀(如 qwen-flash-us):模型为美国部署模式。

相关文档