全部产品

Android SDK

更新时间:2020-11-24 14:08:14

本文介绍如何使用阿里云智能语音服务提供的Android SDK,包括SDK的安装方法及SDK代码示例。请注意,新用户请关注新版Android SDK。

注意

建议您使用新版本Android SDK,本版本后续将不再更新。详情请参见Android SDK

前提条件

  • 首先阅读接口说明,详情请参见接口说明

  • 已在智能语音管控台创建项目并获取appkey,详情请参见创建项目

  • 已获取智能语音服务访问令牌,详情请参见获取Token

SDK关键接口

  • NlsClient:语音处理客户端,利用该客户端可以进行一句话识别、实时语音识别和语音合成的语音处理任务。该客户端为线程安全,建议全局仅创建一个实例。

  • SpeechRecognizer:代表一次语音识别请求。需要将录制的音频或从文件读取的音频数据,发送给SDK。

  • SpeechRecognizerWithRecorder:代表一次语音识别请求。在SpeechRecognizer的基础上内置录音功能,调用简便,推荐使用。

  • SpeechRecognizerCallback:语音识别回调接口。在获得识别结果、发生错误等事件发生时会触发回调。您可参照示例调用此接口,在回调方法中加入自己的处理逻辑。

  • SpeechRecognizerWithRecorderCallback:语音识别回调接口。在SpeechRecognizerCallback基础上增加了录制的语音数据和音频音量的回调方法。

调用步骤

下面以SpeechRecognizer为例,为您介绍一句话识别请求的调用步骤:

  1. 创建NlsClient实例。

  2. 定义SpeechRecognizerCallback实现类,按您自己的业务需要处理识别结果或错误情况。

  3. 调用NlsClient.createRecognizerRequest()方法得到SpeechRecognizer实例。

  4. 设置SpeechRecognizer参数,主要是accessToken和appkey。

  5. 调用SpeechRecognizer.start()方法开始与云端服务连接。

  6. 采集语音并调用SpeechRecognizer.sendAudio()方法发送给云端服务。

  7. 在回调中处理识别结果或错误。

  8. 调用SpeechRecognizer.stop()方法结束识别。

  9. 如果需要发起新的请求,请重复3~8步。

    注意

    SpeechRecognizer不可重复使用,必须新建实例。

  10. 调用NlsClient.release()方法释放客户端实例。

Proguard配置

如果代码使用了混淆,请在proguard-rules.pro中配置:

-keep class com.alibaba.idst.util.*{*;}

代码示例

  • 创建识别请求

    // 新建识别回调类
    SpeechRecognizerCallback callback = new MyCallback();
    // 创建识别request
    speechRecognizer = client.createRecognizerRequest(callback);
    // 填写Token
    speechRecognizer.setToken("");
    // 填写appkey
    speechRecognizer.setAppkey("");
    // 设置返回中间结果
    speechRecognizer.enableIntermediateResult(true);
    // 启动语音识别
    int code = speechRecognizer.start();
  • 采集音频并发送给识别服务。

    此处音频数据也可以从文件或其他来源获取。如果使用SpeechRecognizerWithRecorder则SDK内部会处理录音并发送数据,此时可以省略该步骤。

    ByteBuffer buf = ByteBuffer.allocateDirect(SAMPLES_PER_FRAME);
    while(sending){
        buf.clear();
        // 采集语音
        int readBytes = mAudioRecorder.read(buf, SAMPLES_PER_FRAME);
        byte[] bytes = new byte[SAMPLES_PER_FRAME];
        buf.get(bytes, 0, SAMPLES_PER_FRAME);
        if (readBytes>0 && sending){
            // 发送语音数据到识别服务
            int code = recognizer.sendAudio(bytes, bytes.length);
            if (code < 0) {
                Toast.makeText(SpeechRecognizerActivity.this, "发送语音失败!", Toast.LENGTH_LONG).show();
                break;
            }
        }
        buf.position(readBytes);
        buf.flip();
    }
  • 处理回调结果。

    // 识别结束,得到最终完整结果。
    @Override
    public void onRecognizedCompleted(final String msg, int code)
    {
        Log.d(TAG,"OnRecognizedCompleted " + msg + ": " + String.valueOf(code));
    }
    
    // 识别返回中间结果,只有开启相关选项时才会回调。
    @Override
    public void onRecognizedResultChanged(final String msg, int code)
    {
        Log.d(TAG,"OnRecognizedResultChanged " + msg + ": " + String.valueOf(code));
    }