百炼 Confidential MaaS 最佳实践-阿里云帮助中心

百炼机密推理服务基于硬件机密计算技术，面向高安全等级场景，数据在传输、计算和存储过程中均处于加密状态，保障用户提示词在云端推理过程中的隐私与安全。

1. 机密部署简介

Confidential MaaS（简称 CMaaS）基于芯片级硬件机密计算技术构建，可有效抵御包括特权攻击在内的多层次安全威胁。其核心安全特性包括：

端到端加密：在 HTTPS 之上建立业务层加密通道，覆盖从客户端到机密推理节点的完整链路。每台节点随机生成根私钥用于会话密钥协商，每次会话独立派生临时密钥；所有密钥仅驻留于加密的易失性存储中，不落盘、不持久化，会话结束即销毁。
安全加固与度量：依托芯片级硬件隔离与软件加固双重机制，对启动链路及运行时环境实施全链路度量；块存储层面，根分区基于 Merkle Tree 机制保障完整性，数据分区采用一次性密钥加密保障机密性。
软硬件透明度：客户端直接访问 TEE 厂商验证硬件生成的远程证明报告真实性，并检查透明日志服务以确认服务端软件制品的完整性。

适用对象：对数据安全有较高要求的企业级场景。

2. 机密部署优势

纵深安全防护：从芯片级硬件隔离、端到端加密传输到客户端可验证的远程证明，构建覆盖硬件、传输与软件的多层防护体系。
低侵入式接入：沿用百炼模型单元概念，控制台创建模型单元时勾选 Confidential MaaS 选项即可启用。业务代码无需重构，仅需替换调用入口与客户端 SDK。机密与非机密路径可在同一账号下并存。

3. 开通使用

本能力为定向邀请使用，请联系您的阿里云商务进行申请开通。开通成功后，使用模型部署控制台（北京）选择支持的模型：

模型名称	模型单元规格	小时单价（元）	包月单价（元）	模型单元数量
GLM-5.1	机密II型模型单元	¥640	¥304,000	8 x 机密II型
Qwen3.5-397B-A17B	机密II型模型单元	¥640	¥304,000	8 x 机密II型

4. 部署后调用

模型部署成功后，支持通过机密推理 SDK 进行调用。

在调用已部署成功的模型时，model的取值应为模型部署成功后的模型code。请前往模型部署控制台（北京）界面获取模型code。

4.1 SDK 安装与构建

前提条件

已安装 Go 开发环境。更多信息，请参见安装Go。
已安装 make 编译工具。

点击此处下载机密推理 SDK并解压之后，您可以

在 SDK 根目录下执行 make命令，在bin目录下构建出机密推理样例命令行程序、OpenAI-Proxy 程序。

此外，您也可以参考 SDK 目录中 README 文档，使用 SDK 自行开发构建适用于您业务场景的机密推理工具。

4.2 调用机密推理

使用机密推理命令行工具

使用命令行工具

# MacOS/Linux
# 请将您的百炼API Key配置在环境变量中
export DASHSCOPE_API_KEY="sk-xxx"
# 请将 --model 后的参数替换为模型部署成功后的code
./cmaas-client --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --prompt "简短介绍大语言模型" --stream

# Windows Powershell
# 请将您的百炼API Key配置在环境变量中
$env:DASHSCOPE_API_KEY = "sk-xxx"
# 请将 --model 后的参数替换为模型部署成功后的code
.\cmaas-client.exe --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --prompt "简短介绍大语言模型" --stream

使用 OpenAI 兼容- Chat 接口

为了便于使用，基于 SDK 构建了 OpenAI 兼容-Chat 接口的 HTTP 本地代理工具。OpenAI Proxy 工具已经在上一章节中make命令构建完成。

本地启动 openai-proxy代理工具

# MacOS/Linux
# 请将您的百炼API Key配置在环境变量中
export DASHSCOPE_API_KEY="sk-xxx"
# 请将 --model 后的参数替换为模型部署成功后的code
./openai-proxy --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --listen :8080

# Windows Powershell
# 请将您的百炼API Key配置在环境变量中
$env:DASHSCOPE_API_KEY = "sk-xxx"
# 请将 --model 后的参数替换为模型部署成功后的code
.\openai-proxy.exe --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --listen :8080

在新的终端中使用 OpenAI Python SDK 发送 OpenAI 兼容 Chat 请求

import os
from openai import OpenAI

client = OpenAI(
    # 若没有配置环境变量，请用百炼API Key将下一行替换为：api_key="sk-xxx",
    api_key=os.getenv('DASHSCOPE_API_KEY'),
    base_url="http://localhost:8080/v1",
)

completion = client.chat.completions.create(
    model="xxx",  # 请替换为模型部署成功后的code
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "你是谁？"},
    ],
    extra_body={"enable_thinking": False},
)

print(completion.choices[0].message.content)

接口功能限制：

不支持多模态输入与显式缓存及相关参数功能（modalities/audio/vl_high_resolution_images）
不支持设置推理力度（reasoning_effort参数）、代码解释器（enable_code_interpreter）等功能。
出于数据安全隐私考虑，不支持联网搜索（enable_search）。
只支持 200k 以下的推理请求上下文。

4.3 查看本地透明度报告

您可以在本地以下目录查看机密推理请求的透明度报告：

macOS: ~/Library/Application\ Support/dashscope-confidential-maas/transparency-reports
Linux: $XDG_DATA_HOME/dashscope-confidential-maas/transparency-reports/
- 若未设置 $XDG_DATA_HOME，则默认为：~/.local/share/dashscope-confidential-maas/transparency-reports/
Windows: %APPDATA%\dashscope-confidential-maas\transparency-reports\
- 通常对应 C:\Users\<用户名>\AppData\Roaming\dashscope-confidential-maas\transparency-reports\

5. 应用场景

CMaaS 主要解决业务需调用云端大模型，但客户数据、业务数据或模型权重至少一方存在"明文不能让对方看到"硬约束的矛盾。

金融风控与反欺诈推理

适用：信贷审核、反欺诈识别、风控辅助决策
优势：数据/模型双盲；对齐 JR/T 0197 C3/C4 级金融数据加密与访问控制要求

政务与央国企大模型应用

适用：内部知识检索、决策辅助、智能问答
优势：敏感文档密文上送、硬件保护区推理、加密回传；

其他典型场景：

医疗影像/病历 AI 诊断（受《个人信息保护法》与 HIPAA 约束）
法律/合同智能审阅（安全环境中处理合同明文）
智能座舱与车端助手（符合《汽车数据安全管理若干规定》）
智能客服与售后工单（含身份证号、银行卡片段等敏感信息）

两类共性：

数据出域受限（金融、医疗、政企、车载典型）
数据/模型双盲（金融、法律典型）