百炼机密推理服务基于硬件机密计算技术,面向高安全等级场景,数据在传输、计算和存储过程中均处于加密状态,保障用户提示词在云端推理过程中的隐私与安全。
1. 机密部署简介
Confidential MaaS(简称 CMaaS)基于芯片级硬件机密计算技术构建,可有效抵御包括特权攻击在内的多层次安全威胁。其核心安全特性包括:
端到端加密:在 HTTPS 之上建立业务层加密通道,覆盖从客户端到机密推理节点的完整链路。每台节点随机生成根私钥用于会话密钥协商,每次会话独立派生临时密钥;所有密钥仅驻留于加密的易失性存储中,不落盘、不持久化,会话结束即销毁。
安全加固与度量:依托芯片级硬件隔离与软件加固双重机制,对启动链路及运行时环境实施全链路度量;块存储层面,根分区基于 Merkle Tree 机制保障完整性,数据分区采用一次性密钥加密保障机密性。
软硬件透明度:客户端直接访问 TEE 厂商验证硬件生成的远程证明报告真实性,并检查透明日志服务以确认服务端软件制品的完整性。
适用对象:对数据安全有较高要求的企业级场景。
2. 机密部署优势
纵深安全防护:从芯片级硬件隔离、端到端加密传输到客户端可验证的远程证明,构建覆盖硬件、传输与软件的多层防护体系。
低侵入式接入:沿用百炼模型单元概念,控制台创建模型单元时勾选 Confidential MaaS 选项即可启用。业务代码无需重构,仅需替换调用入口与客户端 SDK。机密与非机密路径可在同一账号下并存。
3. 开通使用
本能力为定向邀请使用,请联系您的阿里云商务进行申请开通。开通成功后,使用模型部署控制台(北京)选择支持的模型:
模型名称 | 模型单元规格 | 小时单价(元) | 包月单价(元) | 模型单元数量 |
GLM-5.1 | 机密II型模型单元 | ¥640 | ¥304,000 | 8 x 机密II型 |
Qwen3.5-397B-A17B | 机密II型模型单元 | ¥640 | ¥304,000 | 8 x 机密II型 |

4. 部署后调用
模型部署成功后,支持通过机密推理 SDK 进行调用。
在调用已部署成功的模型时,model的取值应为模型部署成功后的模型code。请前往模型部署控制台(北京)界面获取模型code。

4.1 SDK 安装与构建
前提条件
已安装 Go 开发环境。更多信息,请参见安装Go。
已安装 make 编译工具。
点击此处下载机密推理 SDK并解压之后,您可以
在 SDK 根目录下执行
make命令,在bin目录下构建出机密推理样例命令行程序、OpenAI-Proxy 程序。
此外,您也可以参考 SDK 目录中 README 文档,使用 SDK 自行开发构建适用于您业务场景的机密推理工具。
4.2 调用机密推理
使用机密推理命令行工具
使用命令行工具
# MacOS/Linux
# 请将您的百炼API Key配置在环境变量中
export DASHSCOPE_API_KEY="sk-xxx"
# 请将 --model 后的参数替换为模型部署成功后的code
./cmaas-client --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --prompt "简短介绍大语言模型" --stream
# Windows Powershell
# 请将您的百炼API Key配置在环境变量中
$env:DASHSCOPE_API_KEY = "sk-xxx"
# 请将 --model 后的参数替换为模型部署成功后的code
.\cmaas-client.exe --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --prompt "简短介绍大语言模型" --stream使用 OpenAI 兼容- Chat 接口
为了便于使用,基于 SDK 构建了 OpenAI 兼容-Chat 接口的 HTTP 本地代理工具。OpenAI Proxy 工具已经在上一章节中make命令构建完成。
本地启动
openai-proxy代理工具# MacOS/Linux # 请将您的百炼API Key配置在环境变量中 export DASHSCOPE_API_KEY="sk-xxx" # 请将 --model 后的参数替换为模型部署成功后的code ./openai-proxy --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --listen :8080 # Windows Powershell # 请将您的百炼API Key配置在环境变量中 $env:DASHSCOPE_API_KEY = "sk-xxx" # 请将 --model 后的参数替换为模型部署成功后的code .\openai-proxy.exe --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --listen :8080在新的终端中使用 OpenAI Python SDK 发送 OpenAI 兼容 Chat 请求
import os from openai import OpenAI client = OpenAI( # 若没有配置环境变量,请用百炼API Key将下一行替换为:api_key="sk-xxx", api_key=os.getenv('DASHSCOPE_API_KEY'), base_url="http://localhost:8080/v1", ) completion = client.chat.completions.create( model="xxx", # 请替换为模型部署成功后的code messages=[ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "你是谁?"}, ], extra_body={"enable_thinking": False}, ) print(completion.choices[0].message.content)
接口功能限制:
不支持多模态输入与显式缓存及相关参数功能(modalities/audio/vl_high_resolution_images)
不支持设置推理力度(reasoning_effort参数)、代码解释器(enable_code_interpreter)等功能。
出于数据安全隐私考虑,不支持联网搜索(enable_search)。
只支持 200k 以下的推理请求上下文。
4.3 查看本地透明度报告
您可以在本地以下目录查看机密推理请求的透明度报告:
macOS:
~/Library/Application\ Support/dashscope-confidential-maas/transparency-reportsLinux:
$XDG_DATA_HOME/dashscope-confidential-maas/transparency-reports/若未设置
$XDG_DATA_HOME,则默认为:~/.local/share/dashscope-confidential-maas/transparency-reports/
Windows:
%APPDATA%\dashscope-confidential-maas\transparency-reports\通常对应
C:\Users\<用户名>\AppData\Roaming\dashscope-confidential-maas\transparency-reports\
5. 应用场景
CMaaS 主要解决业务需调用云端大模型,但客户数据、业务数据或模型权重至少一方存在"明文不能让对方看到"硬约束的矛盾。
金融风控与反欺诈推理
适用:信贷审核、反欺诈识别、风控辅助决策
优势:数据/模型双盲;对齐 JR/T 0197 C3/C4 级金融数据加密与访问控制要求
政务与央国企大模型应用
适用:内部知识检索、决策辅助、智能问答
优势:敏感文档密文上送、硬件保护区推理、加密回传;
其他典型场景:
医疗影像/病历 AI 诊断(受《个人信息保护法》与 HIPAA 约束)
法律/合同智能审阅(安全环境中处理合同明文)
智能座舱与车端助手(符合《汽车数据安全管理若干规定》)
智能客服与售后工单(含身份证号、银行卡片段等敏感信息)
两类共性:
数据出域受限(金融、医疗、政企、车载典型)
数据/模型双盲(金融、法律典型)
保险(核保/理赔反欺诈)、HR(简历筛选/面试纪要)、跨境业务(需符合 GDPR 的多语言客服)等同样具备上述特征。