Gummy一句话识别、翻译API详情
说明
支持的领域 / 任务:audio(音频) / asr(语音识别)
相关指南:语音识别/翻译,语音识别/翻译-Gummy。
Gummy一句话识别或翻译支持处理一分钟内的语音数据流并流式返回结果,提供丰富的结果供调用者选择,包括中间文字结果、句子级文字、词和时间戳等。适用于对话聊天、指令控制、语音输入法、语音搜索等短时语音交互场景。
不同编程语言的SDK/API在参数命名规则、接口调用方式上存在差异,请根据实际编程语言参阅对应文档:
Java:Java SDK
Python:Python SDK
其它编程语言:WebSocket API