AIGC依托通义千问语言模型及音视频人工智能模型的强大能力,可进行实时语音识别,实现对话的实时记录、多语言翻译、发言总结、内容规整等。构建完美的结构化媒体资料库,旨在为用户提供高效、准确的音视频转写与分析服务。
功能特性
音频转文字:支持多语言的音频文件转写成文字,提高信息处理效率。
发言人区分:自动识别并区分多个发言人的讲话,便于内容整理与分析。
智能速览:提供关键词提取、全文概要、章节速览、发言总结、问答/要点回顾等智能化处理功能。
多语言支持:不仅支持普通话,还支持英语、日语、粤语等多种语言的处理。
翻译服务:可选择将转写结果翻译成英文或日语,满足国际化需求。
高效管理:支持转写结果的查看、编辑、导出、删除及重命名等操作,方便用户管理。
创建转写任务
进入结构化媒资界面。
进入EchoMind。
在左侧导航栏选择
,进入结构化媒资页面。
单击创建任务按钮,进入任务创建页面。
上传音视频文件。
用户首先需要将音视频文件上传到AIGC平台。这些文件可以是本地存储的,也可以是从素材广场添加或从媒资库导入的。
选择音视频文件的转写语言。
支持多种语言的语音转写,包括但不限于普通话、英语、日语、粤语等。用户可以在创建任务时选择音视频文件的语言,以确保转写结果的准确性。
说明章节速览:音视频语言为粤语时仅支持生成章节标题,暂不支持生成章节内容摘要。
选择是否需要将转写结果翻译成英文或日语。
跨国沟通场景下,可以同步开启翻译功能。
根据视频内容,选择是否需要区分发言人。
在转写过程中,如果您选择了开启发言人区分功能,系统会自动识别并区分多个发言人的讲话,为每个发言人分配不同的标识,并在转写结果中明确标注。
完成上述设置后,单击开始转写按钮。
系统自动为您的文件进行转写、翻译、总结等处理,这可能需要一些时间,您可以在工作区右上角查看处理进度。
查看智能总结
转写完成后,系统将进行智能总结,以帮助您快速了解音视频内容。针对不同的音视频语言,支持的功能如下:
智能速览 | 中文 | 英文 | 中英文自由说 | 粤语 | 日语 |
关键词 | ✅ | ✅ | ✅ | ✅ | - |
全文概要 | ✅ | ✅ | - | - | - |
章节速览 | ✅ | ✅ | - | ✅ | - |
发言总结 | ✅ | ✅ | - | - | - |
问答/要点回顾 | ✅ | - | - | - | - |
章节速览:音视频语言为粤语时仅支持生成章节标题,暂不支持生成章节内容摘要。
关键词
您可以查看系统为您总结的关键词,并对其进行编辑。
将鼠标悬停于关键词区域,单击编辑按钮以进行关键词的新增或删除。
单击添加关键词,输入相应文字,即可完成关键词的添加。同时,单击关键词后方的“x”按钮,可将该关键词删除。
单击确定即可完成编辑。
全文概要
您可以在关键词下方查看全文概要,以帮助您快速了解转写内容,提升阅读效率,同时支持一键复制功能。
章节速览
您可以在全文概要下方查看章节速览,以帮助您基于时间线了解音视频内容。
全文检索
您可以选择系统为您提供可能关注的高频词汇,或直接输入所需内容以进行搜索。
发言总结
您可以启用发言人区分功能,并查看发言总结,以便迅速了解每位发言人的观点和思想。
问答回顾
在访谈场景中,系统能够自动提取问答并进行总结;而在非访谈场景下,系统则可自动总结内容要点。
整理转写内容
您可以对识别的原文进行修改,并随时查看识别结果,从而实现高效的记录与便捷的回顾。
编辑识别原文
将鼠标悬停于发言内容区域,单击编辑按钮,即可进入编辑状态,从而对文本进行增删和修改。
查找与替换
若发现全文中某个词汇识别错误,可使用查找与替换功能。您可以选择全部替换或逐个替换当前已识别的结果。
管理发言人
AIGC支持智能区分发言人,您可对发言人进行编辑和筛选,以便于回顾和整理信息,使其更加清晰。
区分发言人。
在上传音视频文件时,可以根据发言人数选择是否区分发言人(包括单人演讲、两人对话以及多人讨论)。系统将自动识别不同的发言人,并使用“发言人 1”、“发言人 2”等方式进行区分。
发言人名称编辑。
你可以单击发言人右侧的编辑按钮,修改发言人名称。该功能支持您单独修改某一发言人名称或对所有同名发言人的名称进行统一修改。
筛选发言人片段。
原文中默认展示所有发言人信息。如若不需查看发言人信息,可选择关闭该功能以隐藏相关信息。
在启用显示发言人功能时,您可以选择要查看的发言人信息,以便对相应段落进行筛选。
收起视频
支持您将视频部分隐藏起来,仅播放音频。帮助您专注于音频内容的听取和分析。
转写结果管理
导出结果至本地:
转写完成后,转写结果支持以源语言或译文语言导出,并可设置导出显示信息。
删除文件:
选择生成的文件,单击删除按钮,删除不再需要的文件。
重命名文件:
选择生成的文件,单击重命名按钮,输入新文件名,保存更改。
OpenAPI相关文档
除了上述使用方式,还提供了通过OpenAPI实现媒资结构化理解的方式。具体信息请参见: