QuerySmarttagJob - 智能标签任务查询接口

查询智能标签任务。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用背景高亮的方式表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
ice:QuerySmarttagJob
*全部资源
*

请求参数

名称类型必填描述示例值
JobIdstring

需要查询的智能标签作业 ID。可以从提交智能标签作业的返回参数中获取。

88c6ca184c0e47098a5b665e2****
Paramsstring

额外的请求参数,使用 JSON 字符串表示,例如:{"labelResultType":"auto"}。其中,labelResultType 为 String 类型,可取值:

  • auto:机器打标结果

  • hmi:人机协同结果

{"labelResultType":"auto"}

返回参数

名称类型描述示例值
object
JobStatusstring

任务状态,可取值:

  • Success:处理成功。

  • Fail:处理失败。

  • Processing:处理中。

  • Submitted:已提交等待处理。

Success
RequestIdstring

请求 ID。

******11-DB8D-4A9A-875B-275798******
UserDatastring

通过 MNS 回调时透传回来的信息。消息格式请参见下文回调消息格式定义。

{"userId":"123432412831"}
Resultsarray<object>

分析结果对象数组。

Resultobject
Typestring

分析结果的类型。

  • - 标签 1.0 分析结果类型:
  1. TextLabel:文本标签
  2. VideoLabel:视频标签
  3. ASR:语音识别原始结果(默认不返回)
  4. OCR:文字识别原始结果(默认不返回)
  5. NLP:NLP 处理结果(默认不返回)
  • - 标签 2.0 分析结果类型:
  1. CPVLabel
  2. Meta:视频标题等信息(默认不返回)
  • - 标签 2.0-custom 分析结果类型:
  1. CPVLabel
  2. Meta:视频标题等信息(默认不返回)
Meta
Datastring

分析结果的具体数据,以 JSON 字符串表示。不同 Type 的数据结构见下文 Result 参数说明。

{"title":"example-title-****"}

回调消息格式定义 当智能标签任务执行状态改变时,mps 会发送消息到用户指定的 queue 中(如何指定回调 queue 详见 mps 的更新管道接口)。消息体是一个 JSON 字符串,包含字段如下:

名称类型描述
TypeString固定字符串“smarttag”,表示智能标签任务
JobIdString任务唯一 ID
StateString任务当前状态,与 QuerySmarttagJob 中的 JobStatus 一致
StateString任务当前状态,与 QuerySmarttagJob 中的 JobStatus 一致
UserDataString用户在 SubmitSmarttagJob 中传入的 UserData
UserDataString用户在 SubmitSmarttagJob 中传入的 UserData

Result 参数说明

VideoLabel 数据结构

名称类型描述
personsJSONArray检测到的人物结果
persons.nameString识别到的人物名称
persons.categoryString人物类型,取值如下:celebrity(名人);politician(政治人物);sensitive(敏感人物);unknown(未知人物);自定义人物库 ID(识别到的人物为自定义人物时返回)
persons.ratiodouble人物出现率,取值:0~1
persons.occurrencesJSONArray人物出场详细信息
persons.occurrences.scoredouble置信度得分
persons.occurrences.fromdouble检测到人物的起始时间,单位(秒)
persons.occurrences.todouble检测到人物的结束时间,单位(秒)
persons.occurrences.positionJSONObject人脸坐标
persons.occurrences.position.leftTopint[]左上角 x,y 坐标
persons.occurrences.position.rightBottomint[]右下角 x,y 坐标
persons.occurrences.timestampdouble人脸坐标所在的时间戳,单位为秒
persons.occurrences.sceneString人物镜头,包括:closeUp(特写);medium-closeUp(近景);medium(中景);medium-long(全景)
tagsJSONArray检测到的物体场景等标签,详见下表举例
tags.mainTagNameString主标签
tags.subTagNameString子标签
tags.ratiodouble出现率,取值:0~1
tags.occurrencesJSONArray出现详细信息
tags.occurrences.scoredouble置信度得分
tags.occurrences.fromdouble起始时间,单位(秒)
tags.occurrences.todouble结束时间,单位(秒)
classificationsJSONArray视频分类信息
classifications.scoredouble置信度得分
classifications.category1String一级分类,比如:生活、动漫、汽车等等
classifications.category2String二级分类,比如生活下面细分为:健康、家居等等

视频 Tags 标签举例说明

mainTagNamesubTagName
节目比如:爸爸去哪儿、欢乐喜剧人等
人物角色比如:医生、护士、教师等
物体比如:钢琴、水杯、桌子、西红柿炒鸡蛋、小汽车、化妆品等
标识比如:CCTV1、CCTV2、优酷、东方卫视等
动作事件比如:跳舞、接吻、拥抱、会晤、唱歌、打电话、骑马、打斗等
地域比如:北京天安门、自由女神像、乐山大佛、中国、美国等
场景比如:卧室、地铁站、梯田、海滩、沙漠等

ImageLabel 数据结构

名称类型描述
personsJSONArray检测到的人物结果
persons.nameString识别到的人物名称
persons.categoryString人物类型,取值如下:celebrity(名人);politician(政治人物);sensitive(敏感人物)
persons.scoredouble人物置信度得分
persons.positionJSONObject人脸坐标
persons.position.leftTopint[]左上角 x,y 坐标
persons.position.rightBottomint[]右下角 x,y 坐标
persons.sceneString人物镜头,包括:closeUp(特写);medium-closeUp(近景);medium(中景);medium-long(全景)
tagsJSONArray检测到的物体场景等标签,详见下表举例
tags.mainTagNameString主标签
tags.subTagNameString子标签
tags.scoredouble置信度得分

图片 tags 标签举例说明

mainTagNamesubTagName
人物角色比如:医生、护士、教师等
地域比如:北京天安门、自由女神像、乐山大佛、中国、美国等
动作事件比如:讲话等
标识比如:CCTV1、CCTV2、优酷、东方卫视等
动作事件比如:跳舞、接吻、拥抱、会晤、唱歌、打电话、骑马、打斗等
物体比如:钢琴、水杯、桌子、西红柿炒鸡蛋、小汽车、化妆品等
场景比如:卧室、地铁站、梯田、海滩、沙漠等

TextLabel 数据结构(来源于 ASR 和 OCR)

名称类型描述
tagsJSONArray文本标签信息,详见下表举例
tags.nameString标签类别
tags.valueString标签值,可能有多个标签值,以半角逗号(,)分割

图片 tags 标签举例说明

namevalue
地域比如:北京天安门、自由女神像、乐山大佛、中国、美国等
组织机构比如:中国生动物保护协会、中央广播电视台等
标识比如:耐克、李宁
关键词比如:中坚力量

CPVLabel 数据结构

  • cates:类目(一级类目、二级类目、三级类目)
  • entities:类目属性(带有知识图谱信息)
  • hotwords:热点词(用户关注的名单)
  • freeTags:自由标签(关键词)
名称类型示例值说明
typeStringhmi结果类型。取值:hmi(人机协同结果)、autp(机器打标结果)
catesJSONArray-分类类目结果
cates.labelLevel1String旅游一级标签
cates.labelLevel2String旅游风光二级标签
cates.labelString""标签名称,算法可能返回空
cates.appearanceProbabilitydouble0.96出现率
cates.detailInfoJSONArray--
cates.detailInfo.scoredouble0.9置信度
cates.detailInfo.startTimedouble0.021开始时间
cates.detailInfo.endTimedouble29.021结束时间
entitiesJSONArray--
entities.labelLevel1String地域一级标签
entities.labelLevel2String地标二级标签
entities.labelString黄果树瀑布标签名称
entities.appearanceProbabilitydouble0.067出现率
entities.knowledgeInfoString{"name": "黄果树瀑布", "nameEn": "Huangguoshu Waterfall", "description": "亚洲四大瀑布之一"}知识图谱信息,全部字段后附表:影视综 IP 图谱、音乐图谱、人物图谱、地标图谱、物体图谱。
entities.detailInfoJSONArray--
entities.detailInfo.scoredouble0.33292606472969055置信度
entities.detailInfo.startTimedouble6.021开始时间
entities.detailInfo.endTimedouble8.021结束时间
entities.detailInfo.trackDataJSONArray-实体标签结构化信息
entities.detailInfo.trackData.scoredouble0.32置信度
entities.detailInfo.trackData.bboxinteger[]23,43,45,67坐标框
entities.detailInfo.trackData.timestampdouble7.9时间戳
hotwordsJSONArray--
hotwords.labelLevel1String关键词一级标签
hotwords.labelLevel1String关键词二级标签
hotwords.labelLevel2String""二级标签
hotwords.labelString中国气象局看点词内容
hotwords.appearanceProbabilitydouble0.96出现率
hotwords.detailInfoJSONArray
hotwords.detailInfo.scoredouble1.0置信度
hotwords.detailInfo.startTimedouble0.021开始时间
hotwords.detailInfo.endTimedouble29.021结束时间
freeTagsJSONArray
freeTags.labelLevel1String关键词一级标签
freeTags.labelLevel2String""二级标签
freeTags.labelString中央气象台看点词内容
freeTags.appearanceProbabilitydouble0.96出现率
freeTags.detailInfoJSONArray
freeTags.detailInfo.scoredouble0.9置信度
freeTags.detailInfo.startTimedouble0.021开始时间
freeTags.detailInfo.endTimedouble29.021结束时间

语音识别 ASR 结果

名称类型描述
detailsJSONArray任务详细结果
details.fromdouble开始时间戳,单位(秒)
details.todouble结束时间戳,单位(秒)
details.contentString识别出的文本内容

文本识别 OCR 结果

名称类型描述
detailsJSONArray任务详细结果
details.timestampdouble时间戳信息,单位(秒)
details.infoJSONArray该时间点识别出的具体信息
details.info.scoredouble置信度得分
details.info.positionJSONObject文字坐标
details.info.position.leftTopint[]左上角 x,y 坐标
details.info.position.rightBottomint[]右下角 x,y 坐标
details.info.contentString识别出的文本内容

Meta 标注结果

说明 如果客户没有使用人机标注,在使用 SubmitSmarttagJob 提交任务时如果指定了 needMetaData,目前 QuerySmarttagJob 返回结果时会返回原始客户输入的标题。
名称类型描述
titleString标题

字幕提取结果 Subtitle

名称类型描述
detailsJSONArray任务详细结果
details.allResultUrlString全部字幕结果 URL,URL 有效期为任务完成后半年内可有效访问
details.chResultUrlString中文结果 URL,URL 有效期为任务完成后半年内可有效访问
details.engResultUrlString英文结果 URL,URL 有效期为任务完成后半年内可有效访问
说明 字幕结果 URL 内容:序号+时间段+字幕内容(每句字幕为一行)

NLP 处理结果

参数名类型说明
transcriptionobject语音转写结果
autoChaptersobject章节速览结果
summarizationobject大模型摘要结果
meetingAssistanceobject智能纪要结果
translationobject文本翻译结果

transcription(语音转录)

参数名类型说明
transcriptionobject语音转写结果对象。
transcription.paragraphslist[]语音转写结构以段落形式组织的集合。
transcription.paragraphs[i].paragraphIdstring段落级别 id。
transcription.paragraphs[i].speakerIdstring发言人 id。
transcription.paragraphs[i].wordslist[]该段落包含的 word 信息。
transcription.paragraphs[i].words[i].idintword 序号,通常无须关注。
transcription.paragraphs[i].words[i].sentenceIdint句子 id,同属于一个 SentenceId 的 word 信息可以组装成一句话。
transcription.paragraphs[i].words[i].startlong该 word 相对于音频起始时间的开始时间,相对时间戳,单位毫秒。
transcription.paragraphs[i].words[i].endlong该 word 相对于音频起始时间的结束时间,相对时间戳,单位毫秒。
transcription.paragraphs[i].words[i].textstringword 文本。

summarization(全文摘要、发言人总结、提问摘要)

参数名类型说明
summarizationobject摘要结果对象,可能包含 0 个或多个不同摘要类型的结果。
summarization.paragraphSummarystring全文摘要结果。
summarization.conversationalSummarylist[]发言总结摘要结果列表。
summarization.conversationalSummary[i].speakerIdstring发言人 id。
summarization.conversationalSummary[i].speakerNamestring发言人名字。
summarization.conversationalSummary[i].summarystring该发言人对应的总结。
summarization.questionsAnsweringSummarylist[]问答摘要结果列表。
summarization.questionsAnsweringSummary[i].questionstring问题
summarization.questionsAnsweringSummary[i].sentenceIdsOfQuestionlist[]提炼出该问题对应的原语音转写的 SentenceId 列表。
summarization.questionsAnsweringSummary[i].answerstring问题对应的答案。
summarization.questionsAnsweringSummary[i].sentenceIdsOfAnswerlist[]总结出该答案对应的原语音转写的 SentenceId 列表。
summarization.mindMapSummarylist[object]思维导图摘要结果列表,可能包含各个主题的摘要、主题间的关系等。
summarization.mindMapSummary[i].titlestring主题的标题。
summarization.mindMapSummary[i].topiclist[object]包含每个主题及其子主题的数组
summarization.mindMapSummary[i].topic[i].titlestring主题的标题。
summarization.mindMapSummary[i].topic[i].topiclist[object]主题的子主题数组,可以是空数组。

translation(全文翻译)

参数名类型说明
translationobject翻译结果对象。
translation.paragraphslist[]翻译结果以段落形式组织的集合,和语音识别结果报文对应。
translation.paragraphs.paragraphIdstring段落分段 id 标识,和语音识别结果中的 ParagraphId 对应。
translation.paragraphs.sentenceslist[]翻译文本集合。
translation.paragraphs.sentences[i].sentenctIdlong句子 id。
translation.paragraphs.sentences[i].startlong该段相对于音频起始时间的开始时间,相对时间戳,单位毫秒。
translation.paragraphs.sentences[i].endlong该段相对于音频起始时间的结束时间,相对时间戳,单位毫秒。
translation.paragraphs.sentences[i].textstring翻译文本,和语音识别结果报文对应。

autoChapters(章节识别)

参数名类型说明
autoChapterslist[]章节速览集合, 含有 0 个、1 个或多个章节速览信息。
autoChapters[i].idint该章节序号。
autoChapters[i].startlong该章节相对于音频起始时间的开始时间,相对时间戳,单位毫秒。
autoChapters[i].endlong该章节相对于音频起始时间的结束时间,相对时间戳,单位毫秒。
autoChapters[i].headlinestring该章节的一句话标题。
autoChapters[i].summarystring章节总结。

meetingAssistance(智能纪要提取,包含关键词、关键句、待办事项提取)

参数名类型说明
meetingAssistanceobject智能纪要结果对象,可能包含 0 个或多个不同类型的结果。
meetingAssistance.keywordslist[]关键词提取结果。
meetingAssistance.keySentenceslist[]关键句提取结果,也称为重点内容。
meetingAssistance.keySentences[i].idlong关键句序号。
meetingAssistance.keySentences[i].sentenceIdlong该关键句在原 ASR 转写中对应的句子 Id。
meetingAssistance.keySentences[i].startlong相对于音频起始时间的开始时间,相对时间戳,单位毫秒。
meetingAssistance.keySentences[i].endlong相对于音频起始时间的结束时间,相对时间戳,单位毫秒。
meetingAssistance.keySentences[i].textstring关键句信息。
meetingAssistance.actionslist[]待办内容、待办摘要的集合。
meetingAssistance.actions[i].idlong待办序号。
meetingAssistance.actions[i].sentenceIdlong该关键句在原 ASR 转写中对应的句子 Id。
meetingAssistance.actions[i].startlong相对于音频起始时间的开始时间,相对时间戳,单位毫秒。
meetingAssistance.actions[i].endlong相对于音频起始时间的结束时间,相对时间戳,单位毫秒。
meetingAssistance.actions[i].textstring待办内容。
meetingAssistance.classificationsobject场景分类,目前只有 3 中场景分类。
meetingAssistance.classifications.interviewfloat面试场景置信度得分。
meetingAssistance.classifications.lecturefloat演讲场景置信度得分。
meetingAssistance.classifications.meetingfloat会议场景置信度得分。

示例

正常返回示例

JSON格式

{
  "JobStatus": "Success",
  "RequestId": "******11-DB8D-4A9A-875B-275798******",
  "UserData": "{\"userId\":\"123432412831\"}",
  "Results": {
    "Result": [
      {
        "Type": "Meta",
        "Data": "{\"title\":\"example-title-****\"}\t\n"
      }
    ]
  }
}

错误码

访问错误中心查看更多错误码。

变更历史

变更时间变更内容概要操作
2022-08-25新增 OpenAPI查看变更详情