Android SDK(旧版)
本文介绍了如何使用阿里云智能语音服务提供的旧版Android SDK,包括SDK的安装方法及SDK代码示例。请注意,新用户请关注新版Android SDK。
建议您使用新版本Android SDK,本版本后续将不再更新。详情请参见Android SDK。
前提条件
SDK关键接口
NlsClient:语音处理客户端,利用该客户端可以进行一句话识别、实时语音识别和语音合成的语音处理任务。该客户端为线程安全,建议全局仅创建一个实例。
SpeechTranscriber:代表一次实时语音流识别请求,需要将录制的音频或从文件读取的音频数据,发送给SDK。
SpeechTranscriberWithRecorder:代表一次实时语音识别请求,在SpeechTranscriber的基础上内置录音功能,调用更简便。
SpeechTranscriberCallback:语音识别回调接口,在获得识别结果、发生错误等事件发生时会触发回调。您可参照demo在回调方法中加入需要的处理逻辑。
SpeechTranscriberWithRecorderCallback:语音识别回调接口,在SpeechTranscriberCallback基础上增加了回调语音数据和音频音量的方法。
调用步骤
下面以SpeechTransciberActivity.java为例,为您介绍实时语音识别请求的调用步骤:
创建NlsClient的实例。
定义SpeechTranscriberCallback类,根据您的业务需要,处理识别结果或错误情况。
调用NlsClient.createTranscriberRequest()方法得到SpeechTranscriber的实例。
设置SpeechTranscriber参数,主要是Access Token和Appkey。
调用SpeechTranscriber.start()方法启动与云端服务连接。
采集语音并调用SpeechTranscriber.sendAudio()方法发送至云端服务。
在回调中处理识别结果或错误。
调用SpeechTranscriber.stop()方法结束识别。
如果需要发起新的请求,请重复第3~8步。
调用NlsClient.release()方法释放客户端实例。
Proguard配置
如果代码使用了混淆,请在proguard-rules.pro中配置:
-keep class com.alibaba.idst.util.*{*;}
代码示例
创建识别请求。
// 新建识别回调类 SpeechTranscriberCallback callback = new MyCallback(); // 创建识别request speechTranscriber = client.createTranscriberRequest(callback); speechTranscriber.setToken(""); speechTranscriber.setAppkey(""); // 设置返回中间结果 speechTranscriber.enableIntermediateResult(true); // 启动语音识别 int code = speechTranscriber.start();
采集音频并发送给识别服务。
音频数据也可以是从文件或其他来源获取。如果使用SpeechTranscriberWithRecorder接口,则SDK内部会处理录音并发送数据,此时可以省略该步骤。
ByteBuffer buf = ByteBuffer.allocateDirect(SAMPLES_PER_FRAME); while(sending){ buf.clear(); // 采集语音 int readBytes = mAudioRecorder.read(buf, SAMPLES_PER_FRAME); byte[] bytes = new byte[SAMPLES_PER_FRAME]; buf.get(bytes, 0, SAMPLES_PER_FRAME); if (readBytes>0 && sending){ // 发送语音数据到识别服务 int code = recognizer.sendAudio(bytes, bytes.length); if (code < 0) { Log.w(TAG, "Failed to send audio!"); break; } } buf.position(readBytes); buf.flip(); }
处理回调结果。
// 识别到一个新句子开始 @Override public void onSentenceBegin(String msg, int code) { Log.i(TAG, "Sentence begin"); } // 当前句子识别结束,得到完整的句子文本。 @Override public void onSentenceEnd(final String msg, int code) { Log.d(TAG,"OnSentenceEnd " + msg + ": " + String.valueOf(code)); } // 识别返回中间结果,只有开启相关选项时才会回调。 @Override public void onTranscriptionResultChanged(final String msg, int code) { Log.d(TAG,"OnTranscriptionResultChanged " + msg + ": " + String.valueOf(code)); }