Gummy实时语音识别、翻译API详情-大模型服务平台百炼-阿里云

说明

支持的领域 / 任务：audio（音频） / asr（语音识别）

Gummy实时语音识别或翻译支持处理长时间的语音数据流并流式返回结果，提供丰富的结果供调用者选择，包括中间文字结果、句子级文字、词和时间戳等。适用于会议演讲、视频直播等长时间不间断的场景。

不同编程语言的SDK/API在参数命名规则、接口调用方式上存在差异，请根据实际编程语言参阅对应文档：