全部产品
云市场

视频AI参数说明

更新时间:2019-07-10 12:03:08

AI模板内容信息 AITemplateInfo

名称 类型 必填项 描述
TemplateId String 模板ID
TemplateType String 模板类型
TemplateName String 模板名称
TemplateConfig String 模板详细配置。Json字符串,详见AITemplateConfig
Source String 模板来源:
System:系统
Custom:自定义
IsDefault String 是否默认,Default(是), NotDefault(否)
CreationTime String 创建时间,UTC格式
ModifyTime String 修改时间,UTC格式

AI模板配置信息 AITemplateConfig

当TemplateType为AIMediaAudit时:

字段名 类型 必填 描述
AuditItem String[] 审核项。取值范围:terrorism(暴恐)、porn(鉴黄)
AuditRange String[] 审核范围。取值范围:video(视频)、image-cover(封面)、text-title(标题)
AuditContent String[] 审核内容。取值范围:screen(画面)
AuditAutoBlock String 智能审核命中违规后,是否自动屏蔽视频。取值范围:no(否)、yes(是)

智能审核结果 AIMediaAuditResult

字段名 类型 必填 描述
Suggestion String 审核结果建议。取值范围:block(违规)、review(疑似)、pass(通过)。
Label String 审核结果分类。多值用逗号分隔,取值范围:porn(鉴黄)、terrorism(暴恐涉政)、normal(正常)。
AbnormalModules String 违规的审核内容。多值用逗号分隔,取值范围:video(视频)、image-cover(封面)、text-title(标题)
VideoResult VideoAuditResult 视频审核结果。
ImageResult ImageAuditResult[] 图片审核结果。
TextResult TextAuditResult[] 文本审核结果。

VideoAuditResult

字段名 类型 必填 描述
Suggestion String 审核结果建议。取值范围:block(违规)、review(疑似)、pass(通过)
Label String 审核结果分类。多值用逗号分隔,取值范围:porn(鉴黄)、terrorism(暴恐涉政)、normal(正常)。
TerrorismResult TerrorismResultItem 暴恐涉政审核结果。
PornResult PornResultItem 鉴黄审核结果。

TerrorismResultItem

字段名 类型 必填 描述
Suggestion String 审核结果建议。取值范围:block(违规)、review(疑似)、pass(通过)
Label String 审核结果分类。取值范围:terrorism(暴恐)、outfit(特殊装束)、 logo(特殊标识)、 weapon(武器)、politics(渉政)、others(其它暴恐渉政)、normal(正常)。
TopList TerrorismTopListItem[] 命中Label下分数最高的图片信息。

TerrorismTopListItem

字段名 类型 必填 描述
Label String 审核结果分类。取值范围:terrorism(暴恐)、outfit(特殊装束)、 logo(特殊标识)、 weapon(武器)、politics(渉政)、others(其它暴恐渉政)、normal(正常)。
Score String 命中Label的图片的分数。取值范围[0, 100],结果为对应分类Label的概率,值越高越趋于该分类。
Timestamp String 视频中的位置。单位:毫秒
Url String 图片的地址。

PornResultItem

字段名 类型 必填 描述
Suggestion String 审核结果建议。取值范围:block(违规)、review(疑似)、pass(通过)。
Label String 审核结果分类。取值范围:porn(色情)、sexy(性感)、normal(普通)。
TopList PornTopListItem[] 命中Label下分数最高的图片信息。

PornTopListItem

字段名 类型 必填 描述
Label String 审核结果分类。取值范围:porn(色情)、sexy(性感)、normal(普通)。
Score String 命中Label的图片的分数。取值范围[0, 100]。结果为对应分类Label的概率,值越高越趋于该分类。
Timestamp String 视频中的位置。单位:毫秒
Url String 图片的地址。

ImageAuditResult

字段名 类型 必填 描述
Suggestion String 审核结果建议。取值范围:block(违规)、review(疑似)、pass(通过)
Label String 审核结果分类。多值用逗号分隔,取值范围:porn(鉴黄)、terrorism(暴恐涉政)、normal(正常)。
Type String 图片分类。取值范围:cover(封面)
Url String 图片的地址。
Result ImageAuditResultItem[] 图片审结结果详情。

ImageAuditResultItem

字段名 类型 必填 描述
Suggestion String 审核结果建议。取值范围:block(违规)、review(疑似)、pass(通过)
Label String 审核结果分类。当scene为porn时:可取值porn(色情)、sexy(性感)、normal(普通);当scene为terrorism时:可取值terrorism(暴恐)、outfit(特殊装束)、logo(特殊标识)、weapon(武器)、politics(渉政)、others(其它暴恐渉政)、normal(普通)
Score String 命中Label的图片的分数。取值范围[0, 100],结果为对应分类Label的概率,值越高越趋于该分类。
Scene String 审核场景。取值范围:terrorism(恐涉政审)、porn(鉴黄)。

TextAuditResult

字段名 类型 必填 描述
Suggestion String 审核结果建议。取值范围:block(违规)、review(疑似)、pass(通过)
Label String 审核结果分类。spam(含垃圾信息)、ad(广告)、abuse(辱骂)、flood(灌水)、contraband(违禁)、meaningless(无意义)、normal(普通)。
Score String 命中Label的图片的分数。取值范围[0, 100],结果为对应分类Label的概率,值越高越趋于该分类。
Scene String 审核场景。取值:antispam(文本反垃圾)
Type String 文本分类。取值范围:title(标题)

视频DNA结果 AIMediaDNAResult

名称 类型 必填项 描述
VideoDNA VideoDNA[] 视频DNA识别结果。

VideoDNA

名称 类型 必填项 描述
PrimaryKey String 相似视频ID
Similarity String 视频相似度
Detail VideoDNADetail[] 相似视频详情,包括视频的位置、时长等

VideoDNADetail

名称 类型 必填项 描述
Input VideoDNADetailItem 输入视频的开始时间和时长
Duplication VideoDNADetailItem 库中视频的开始时间和时长

VideoDNADetailItem

名称 类型 必填项 描述
Start String 视频的开始时间
Duration String 视频的时长

多模态内容理解结果 AIVideoTagResult

字段名 类型 必填项 取值
Person AIVideoTagResultItem[] 人物标签的集合。
Time AIVideoTagResultItem[] 时间标签的集合。
Location AIVideoTagResultItem[] 地点标签的集合。
Keyword AIVideoTagResultItem[] 关键词标签的集合。
Category AIVideoTagResultItem[] 视频分类的集合。
OrigASRData AIASRData 原始的ASR结果数据。只有当SubmitAIJob服务的请求参数Config>AIVideoTag>AnalyseTypes的值包含ASR,且Config>AIVideoTag>OrigASRData的值为true时才会返回

AIVideoTagResultItem

字段名 类型 必填项 取值
Tag String 标签。
Times String[] 时间点的集合。单位:毫秒。
FaceUrl String 人脸URL。注意:只有人物标签结果会返回该字段。

语音识别结果 AIASRData

字段名 类型 必填项 取值
Duration String 音频时长,单位:毫秒。
AsrTextList AsrText[] 语音识别为文本的结果,数组里的元素是一个句子,详情见AsrText

单句结果 AsrText

字段名 类型 必填项 取值
StartTime Long 该句的起始时间偏移,单位为毫秒。
EndTime Long 该句的结束时间偏移,单位为毫秒。
Text String 该句的识别文本结果。
ChannelId Int 声道号。
SpeechRate Int 该句的平均语速,单位为每分钟字数。