百炼 Confidential MaaS 最佳实践

更新时间:
复制 MD 格式

百炼机密推理服务基于硬件机密计算技术,面向高安全等级场景,数据在传输、计算和存储过程中均处于加密状态,保障用户提示词在云端推理过程中的隐私与安全。

1. 机密部署简介

Confidential MaaS(简称 CMaaS)基于芯片级硬件机密计算技术构建,可有效抵御包括特权攻击在内的多层次安全威胁。其核心安全特性包括:

  • 端到端加密:在 HTTPS 之上建立业务层加密通道,覆盖从客户端到机密推理节点的完整链路。每台节点随机生成根私钥用于会话密钥协商,每次会话独立派生临时密钥;所有密钥仅驻留于加密的易失性存储中,不落盘、不持久化,会话结束即销毁。

  • 安全加固与度量:依托芯片级硬件隔离与软件加固双重机制,对启动链路及运行时环境实施全链路度量;块存储层面,根分区基于 Merkle Tree 机制保障完整性,数据分区采用一次性密钥加密保障机密性。

  • 软硬件透明度:客户端直接访问 TEE 厂商验证硬件生成的远程证明报告真实性,并检查透明日志服务以确认服务端软件制品的完整性。

适用对象:对数据安全有较高要求的企业级场景。

2. 机密部署优势

  • 纵深安全防护:从芯片级硬件隔离、端到端加密传输到客户端可验证的远程证明,构建覆盖硬件、传输与软件的多层防护体系。

  • 低侵入式接入:沿用百炼模型单元概念,控制台创建模型单元时勾选 Confidential MaaS 选项即可启用。业务代码无需重构,仅需替换调用入口与客户端 SDK。机密与非机密路径可在同一账号下并存。

3. 开通使用

本能力为定向邀请使用,请联系您的阿里云商务进行申请开通。开通成功后,使用模型部署控制台(北京)选择支持的模型:

模型名称

模型单元规格

小时单价(元)

包月单价(元)

模型单元数量

GLM-5.1

机密II型模型单元

¥640

¥304,000

8 x 机密II

Qwen3.5-397B-A17B

机密II型模型单元

¥640

¥304,000

8 x 机密II

image

4. 部署后调用

模型部署成功后,支持通过机密推理 SDK 进行调用。

在调用已部署成功的模型时,model的取值应为模型部署成功后的模型code。请前往模型部署控制台(北京)界面获取模型code

image

4.1 SDK 安装与构建

前提条件

  • 已安装 Go 开发环境。更多信息,请参见安装Go

  • 已安装 make 编译工具。

点击此处下载机密推理 SDK并解压之后,您可以

  • 在 SDK 根目录下执行 make命令,在bin目录下构建出机密推理样例命令行程序、OpenAI-Proxy 程序。

此外,您也可以参考 SDK 目录中 README 文档,使用 SDK 自行开发构建适用于您业务场景的机密推理工具。

4.2 调用机密推理

使用机密推理命令行工具

使用命令行工具

# MacOS/Linux
# 请将您的百炼API Key配置在环境变量中
export DASHSCOPE_API_KEY="sk-xxx"
# 请将 --model 后的参数替换为模型部署成功后的code
./cmaas-client --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --prompt "简短介绍大语言模型" --stream

# Windows Powershell
# 请将您的百炼API Key配置在环境变量中
$env:DASHSCOPE_API_KEY = "sk-xxx"
# 请将 --model 后的参数替换为模型部署成功后的code
.\cmaas-client.exe --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --prompt "简短介绍大语言模型" --stream

使用 OpenAI 兼容- Chat 接口

为了便于使用,基于 SDK 构建了 OpenAI 兼容-Chat 接口的 HTTP 本地代理工具。OpenAI Proxy 工具已经在上一章节中make命令构建完成。

  1. 本地启动 openai-proxy代理工具

    # MacOS/Linux
    # 请将您的百炼API Key配置在环境变量中
    export DASHSCOPE_API_KEY="sk-xxx"
    # 请将 --model 后的参数替换为模型部署成功后的code
    ./openai-proxy --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --listen :8080
    
    # Windows Powershell
    # 请将您的百炼API Key配置在环境变量中
    $env:DASHSCOPE_API_KEY = "sk-xxx"
    # 请将 --model 后的参数替换为模型部署成功后的code
    .\openai-proxy.exe --endpoint wss://dashscope.aliyuncs.com/api-ws/v1/inference --model <code> --listen :8080
  2. 在新的终端中使用 OpenAI Python SDK 发送 OpenAI 兼容 Chat 请求

    import os
    from openai import OpenAI
    
    client = OpenAI(
        # 若没有配置环境变量,请用百炼API Key将下一行替换为:api_key="sk-xxx",
        api_key=os.getenv('DASHSCOPE_API_KEY'),
        base_url="http://localhost:8080/v1",
    )
    
    completion = client.chat.completions.create(
        model="xxx",  # 请替换为模型部署成功后的code
        messages=[
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "你是谁?"},
        ],
        extra_body={"enable_thinking": False},
    )
    
    print(completion.choices[0].message.content)

接口功能限制:

  • 不支持多模态输入与显式缓存及相关参数功能(modalities/audio/vl_high_resolution_images)

  • 不支持设置推理力度(reasoning_effort参数)、代码解释器(enable_code_interpreter)等功能。

  • 出于数据安全隐私考虑,不支持联网搜索(enable_search)。

  • 只支持 200k 以下的推理请求上下文。

4.3 查看本地透明度报告

您可以在本地以下目录查看机密推理请求的透明度报告:

  • macOS: ~/Library/Application\ Support/dashscope-confidential-maas/transparency-reports

  • Linux: $XDG_DATA_HOME/dashscope-confidential-maas/transparency-reports/

    • 若未设置 $XDG_DATA_HOME,则默认为:~/.local/share/dashscope-confidential-maas/transparency-reports/

  • Windows: %APPDATA%\dashscope-confidential-maas\transparency-reports\

    • 通常对应 C:\Users\<用户名>\AppData\Roaming\dashscope-confidential-maas\transparency-reports\

5. 应用场景

CMaaS 主要解决业务需调用云端大模型,但客户数据、业务数据或模型权重至少一方存在"明文不能让对方看到"硬约束的矛盾。

金融风控与反欺诈推理

  • 适用:信贷审核、反欺诈识别、风控辅助决策

  • 优势:数据/模型双盲;对齐 JR/T 0197 C3/C4 级金融数据加密与访问控制要求

政务与央国企大模型应用

  • 适用:内部知识检索、决策辅助、智能问答

  • 优势:敏感文档密文上送、硬件保护区推理、加密回传;

其他典型场景:

  • 医疗影像/病历 AI 诊断(受《个人信息保护法》与 HIPAA 约束)

  • 法律/合同智能审阅(安全环境中处理合同明文)

  • 智能座舱与车端助手(符合《汽车数据安全管理若干规定》)

  • 智能客服与售后工单(含身份证号、银行卡片段等敏感信息)

两类共性:

  • 数据出域受限(金融、医疗、政企、车载典型)

  • 数据/模型双盲(金融、法律典型)

保险(核保/理赔反欺诈)、HR(简历筛选/面试纪要)、跨境业务(需符合 GDPR 的多语言客服)等同样具备上述特征。