说明
支持的领域 / 任务:audio(音频) / asr(语音识别)
相关指南:语音识别/翻译,语音识别/翻译-Gummy。
Gummy实时语音识别或翻译支持处理长时间的语音数据流并流式返回结果,提供丰富的结果供调用者选择,包括中间文字结果、句子级文字、词和时间戳等。适用于会议演讲、视频直播等长时间不间断的场景。
不同编程语言的SDK/API在参数命名规则、接口调用方式上存在差异,请根据实际编程语言参阅对应文档:
Java:Java SDK
Python:Python SDK
其它编程语言:WebSocket API
该文章对您有帮助吗?