文档

开发套件快速入门

更新时间:

本文档介绍快速入门体验,帮助您快速体验通义听悟能力。

说明

如果您需要咨询更多产品问题,欢迎通过钉钉搜索群号44604776,加入听悟产品咨询群联系我们。

一、注册账号

访问阿里云官网,在阿里云官网右上角单击登录/注册,按照操作提示完成账号注册。

二、开通服务

  1. 登录通义听悟控制台

  2. 在概览页单击立即开通

  3. 产品开通页面,选择服务类型。

    • 选择试用。新开通服务的用户可免费试用90天。

      image

      服务能力

      免费试用期间权益

      试用期过后如何继续使用

      实时记录

      • 每天免费使用额度为48小时,当日免费额度用完后,在24小时后才可以重新使用。

      • 麦克风:无使用限制。

      • 并发限制:2路。

      1. 服务管理与开通页面将实时记录服务升级为商用版。

      2. 升级为商用版之后,进入后付费按时长计费模式。

      音视频文件记录

      • 上传文件:每天免费使用额度为2小时(音频时长),当日免费额度用完后,在24小时后才可以重新使用。

      • 麦克风:无使用限制。

      • 并发限制:1路。

      1. 服务管理与开通页面将音视频文件记录服务升级为商用版。

      2. 升级为商用版之后,进入后付费按时长计费模式。

    • 选择商用。开通后按通过接口请求的时长计量计费,通义听悟开发套件服务会根据实际使用量从您的阿里云账户余额中扣费。

      image
      说明

      商用版详细计费规则,请前往计费说明查看。

  4. 勾选通义听悟开发套件服务协议,单击立即开通,即可开通通义听悟开发套件服务。

三、设置权限策略(仅适用于RAM子账户)

重要

主账户使用通义听悟可忽略此步骤。

使用通义听悟开发套件时,需要读取对象存储OSS和Rocket MQ的列表。如果RAM子账户没有读取对象存储OSS和Rocket MQ的列表的权限,会出现下图提示:

image

因此RAM子账户在使用听悟前,需要联系主账户在RAM控制台按以下步骤授权:

  1. RAM控制台权限管理 > 权限策略中,创建自定义权限策略,权限策略配置内容如下。

  2. {
        "Version": "1",
        "Statement": [
            {
                "Effect": "Allow",
                "Action": "oss:ListBuckets",
                "Resource": "acs:oss:*:*:*"
            },
            {
                "Effect": "Allow",
                "Action": "mq:QueryInstanceBaseInfo",
                "Resource": "acs:mq:*:*:*"
            }
        ]
    }
  1. RAM控制台身份管理 > 用户中,找到RAM子账户,单击操作列的添加权限,选择上一步创建的自定义策略,和系统策略中的“AliyunTingwuFullAccess”管理通义听悟服务(Tingwu)的权限,授予RAM子账户。

完成上述授权后,RAM子账户即可正常使用听悟开发套件。

四、创建项目

  1. 通义听悟控制台左侧导航栏,单击我的项目

  2. 我的项目页,单击创建项目(如首次创建项目则也可单击立即创建)。

    image
    1. 账号首次创建项目需授权通义听悟开发套件服务获取对象存储OSS和Rocket MQ关键角色。

      image该授权为允许通义听悟开发套件服务通过阿里云的访问控制服务,获取您的对象存储OSS智能纪要写入和音视频文件记录任务处理完成等通知。必须授权后,才可继续创建项目。通义听悟开发套件将只会通知您的服务任务处理状态和写入处理结果,不会读取或查询您的数据,请放心授权。

    2. 输入项目名称。

    3. 选择对象存储,如下拉列表中无所需Bucket可单击右侧创建对象存储bucket。

      通义听悟会向项目配置的OSS Bucket里写入一个测试文件tingwu/initfile.txt,写入成功则检查通过。image

      说明

      建议Bucket与项目的Region相同,跨Region会降低数据存储成功率;通义听悟将在此Bucket下,按每次请求的以tingwu开头的object写入处理结果数据。

    4. 选择回调方式。

      • 如选择HTTP post协议,需要输入URL。通义听悟会向配置的HTTP URL发送post请求,返回的HTTP status为200则检查通过。

      • 如选择Rocket MQ 的 HTTP,需要先创建一个Rocket MQ4.0实例,创建以“TOPIC_TINGWU_”开头的topic。通义听悟会向配置的RocketMQ通过HTTP协议发送消息,消息写入成功则检查通过。

      • 如选择不设置回调主动轮询,则实时记录需轮询接口:GetMeetingTrans;音视频文件记录则需要轮询接口:GetFileTrans。每个账户轮询的QPS为:100。

        image
        说明
        • 通义听悟开发套件服务的RAM账号将获取 Rocket MQ 的服务授权。仅支持Rocket MQ 4.0实例,且topic必须以“TOPIC_TINGWU_”开头。

        • 选择HTTP post协议或Rocket MQ回调方式,通义听悟会向配置的回调地址发送连通性检查消息:{"Code":"0","Data":{"Test":"checkSyncConf+时间戳"},"Message":"success.","RequestId":"xxxxxx"}。

    5. 输入项目描述(可选)。

五、(可选)测试效果

  1. 通义听悟开发套件控制台我的项目列表页,单击项目列表右侧操作列的详情及语音服务效果测试

    image

  1. 测试中文、英文和粤语的识别准确率。

    1. 当测试语言如果选择中文/英文/粤语,选择测试方式为麦克风输入,单击开始录音,可查看实时识别的转写结果,60s后自动停止识别。单击确认,返回项目列表页。

      image
    2. 当测试语言如果选择中文/英文/粤语,选择测试方式为音频文件,单击上传本地文件,上传成功后,可查看识别后的转写结果,上传的音频文件可在线播放。单击确认,返回项目列表页。

      image

六、开发接入

接入方法详见:开发参考

七、查看服务用量及账单

服务用量查询方法详见:查看服务用量

账单查询方法详见:查询账单明细

  • 本页导读 (0)
文档反馈