使用指南-大模型服务平台百炼(Model Studio)-阿里云帮助中心

本文介绍如何配置并使用通义听悟-智能纪要Agent。

准备工作

开通通义听悟 Agent 服务。

说明

开通后即可使用阿里云百炼平台全系通义听悟 Agent 服务。

一、创建应用

点击控制台页面中间或右上角的创建应用按钮，进行应用创建，支持创建最多100个应用。

20251013175114

二、调试配置

完成调试配置后，您可多次体验效果，确认效果满足预期后再发布应用，并参照API接入进行实际开发调用。

1. 选择音频输入方式

20251009135412

内容来源

选择以下任一内容来源：

录音文件识别：支持mp3、wav、m4a、wma、aac、ogg、amr、flac、aiff格式的音频文件和mp4、wmv、m4v、flv、rmvb、dat、mov、mkv、webm、avi、mpeg、3gp、ogg格式的视频文件。文件大小不超过6 GB。
实时转写：采集音频并进行实时转写。
通义听悟任务：填写当前应用历史已完成的转写任务ID（TaskID），可节省语音转文字成本。
说明
任务创建成功后，系统将在响应中返回TaskID字段。

会议文本内容：按格式录入对话内容文本，也可节省语音转文字成本。

示例1：
发言人1：对话内容。
发言人2：对话内容。
示例2：
销售：对话内容。
客户：对话内容。

音频类型

20251009142933

仅限内容来源为录音文件识别时需要选择音频类型：

电话录音或 16K及以上单声道
16K及以上多声道（车载设备录制）

转写模型

20251009142955

仅限内容来源为录音文件识别和实时转写时需要选择转写模型：

paraformer-v2（中英文）
paraformer-v2（中英日韩粤语）
paraformer-v2 (英)
paraformer-v2 (粤)
paraformer-v2 (日)
paraformer-v2 (韩)
教育领域模型（中英）
汽车领域模型（中英粤）

转写配置

20251009143013

仅限内容来源为录音文件识别和实时转写时可以配置角色分离和识别语种：

角色分离：支持选择两人或多人角色分离。

识别语种：基于不同转写模型选择，提供对应的识别语种选项。

翻译：支持对识别原文进行翻译，语种包括中文、英语、日语、韩语、德语、法语、俄语。

热词：支持添加并管理热词组，使用热词可以有效提高语音识别效果。

2. 设定大模型参数

20251009143038

分析模型

目前支持以下模型：

默认项（官方搭配最佳效果的模型组合）
tingwu-plus
qwen-plus
qwq

分析项

配置大模型分析选项，包括以下能力：

要点提炼：支持关键词和待办事项提取。

摘要总结：支持全文摘要、发言总结、要点回顾、思维导图提取。

全文摘要，支持选择一段话摘要或 Markdown 格式摘要。
思维导图，支持选择带时间戳或不带时间戳。

PPT分析：当内容来源为录音文件识别，且文件为视频时，支持对视频中的 PPT进行提取和讲解总结。

其他：包括章节速览、口语书面化、自定义 Prompt 功能。

章节速览支持对速览粒度（细粒度、中粒度、粗粒度）和标题长度（长、中等、短）进行设定。
自定义 Prompt 是指由客户自主定义大模型提示词，引导大模型完成客户定义的各类任务。自定义 Prompt 模型可单独选择，和所选分析模型不冲突。使用自定义 Prompt 功能时，支持设定大模型输出格式，包括：仅发言人信息+转写结果、句子序号+发言人信息+转写结果、仅转写结果三种格式。

说明

界面化的应用配置可对 API 生效，也可在 API 中更新参数，覆盖界面应用配置。

完成上述配置后，即可点击立即分析按钮进行调试（步骤3. API 调用配置仅在接口调用时需要参考）。

如需查看调试效果和测试记录，请参见体验效果。

3. API 调用配置

20251009143103

回调方式

说明

此处回调方式设置请参考如何通过回调获取异步任务结果

HTTP post 协议：需要您输入对应 URL 地址，通义听悟会向配置的HTTP URL发送post请求，返回的HTTP status为200则检查通过。
不设置回调（主动轮询）：如果您选择不设置回调，自行主动轮询，可使用Agent任务的轮询接口：getTask；默认每个账户轮询的 QPS 为：100
事件总线：处理结果将按事件总线北京 Region 的 default 配置，发送到您的服务（需要提前开通阿里云事件总线）

当服务端接收到回调消息，并返回200的 HTTP 状态码后，该应用项目才能创建成功，消息格式如下：

{
  "output": {
      "transcriptionPath": "https://***.oss-cn-hangzhou.aliyuncs.com/***",
      "status": 0
  },
  "requestId": "***",
  "taskInfo": {
      "dataId": "***",
      "userSpaceId": "llm-***",
      "appId": "***",
      "model": "tingwu-***",
      "userId": "***"
  }
}