Gummy实时语音识别、翻译API详情

说明

支持的领域 / 任务:audio(音频) / asr(语音识别)

相关指南:语音识别/翻译语音识别/翻译-Gummy

Gummy实时语音识别或翻译支持处理长时间的语音数据流并流式返回结果,提供丰富的结果供调用者选择,包括中间文字结果、句子级文字、词和时间戳等。适用于会议演讲、视频直播等长时间不间断的场景。

不同编程语言的SDK/API在参数命名规则、接口调用方式上存在差异,请根据实际编程语言参阅对应文档: