智能问答API

更新时间:
复制为 MD 格式

基于丰富的全模态搜索与理解能力,通过AI搜问平台上搭建的问答应用,当前功能可以支持针对数据集内图片、文档、视频进行深度问答能力。可以通过文本、图片或图文作为问题输入,同时支持定制问答助手的回复方式,获得针对数据集全集内容的回答,快速适配大数据下的各类问答场景。其中视频相关素材另有模板化输出,可定制化总结提炼视频内容。

接口说明

接入说明:

智能问答流式接口,支持多模态输入(文本、图片、结构化数据)和流式输出(文本、图片、视频、信源等)。接口采用 SSE(Server-Sent Events)协议推送响应数据,每个数据流为一个 JSON 对象,输出时会通过 type 字段标记不同数据类型。

数据源:

支持对视频进行问答,可通过CleverSee AI 搜问平台的产品界面内或通过数据集数据新增/更新 API完成数据上传及更新。

认证方式:

通过 阿里云 SDK 调用 CleverSee - 智能问答 服务,具体调用指南请参考:AI问答引擎接口

请求参数

参数名

类型

是否必填

说明

示例值

appId

String

应用/业务标识 ID

"2048962366415007746"

sessionId

string

问答会话 ID,用于记录同一个用户的多次问答。

req_123456789

message

Object

用户消息

(见下级字段)

├─ role

String

消息角色,当前仅支持 "user"角色

"user"

└─ parts

Array[Object]

多模态内容块数组,支持文本、文件、结构化数据

(见下级字段)

└─ [Part]

Object

-

单个内容块,根据 type 区分类型

(见下级字段)

├─ type

String

内容块类型固定值,仅支持"text" / "file" / "data"

"text" / "file" / "data"

├─ text

String

条件必填

当 type="text" 时必填。

• 文本内容,上限1024字符

"请问这个视频讲了什么?"

├─ url

String

条件必填

当 type="file" 时必填。支持以下两种格式:

• 媒体资源cdn地址,当前支持图片,上限5

• 图片编码,使用base64编码字符串上传图像文件(支持位图格式),上限5

"https://example.com/img.jpg"

├─ mediaType

String

条件必填

当 type="file" 时必填。

• 媒体类型,当前仅支持图片 image/pngimage/jpegimage/jpg, image/WEBP, image/BMP, image/GIF, image/TIFF,上限5

"image/png"

└─ data

Object

条件必填

当 type = "data" 时,data 对象为必填。

data 对象结构说明如下:

  • type:字符串类型,必填,表示数据子类型。当前支持的值为 "template",表示视频模板。

  • videoId:字符串类型,条件必填。仅当 type = "template" 时需要填写,表示视频模板 ID;其他类型下可以忽略或填写为 null。

(见下级字段)

options

Object

无需填写

{

"debug": true

}

请求示例

正常请求示例

JSON格式

图文问答请求

  {
    "id": "chat-002",
    "message": {
      "role": "user",
      "parts": [
        { "type": "text", "text": "找下类似这双鞋的款式" },
        {
          "type": "file",
          "url": "https://example.com/image.png",
          "mediaType": "image/png"
        }
      ]
    },
    "options": { "appId": "app_001" }
  }

视频模板请求

{
  "id": "chat-002",
  "message": {
    "role": "user",
    "parts": [
      {
        "type": "text",
        "text": "总结这个视频"
      },
      {
        "type": "data",
        "data": {
          "type": "template",
          "videoId": "vid_001"
        }
      }
    ]
  },
  "options": {
    "appId": "app_001"
  }
}

返回参数

名称

类型

描述

示例值

object

event

string

事件类型说明:

  1. 生命周期

    • start / finish

    • 标记消息的开始和结束

  2. 文本内容

    • text-start / text-delta / text-end

    • Markdown 文本流式输出

  3. 内联媒体

    • data-image-info / data-video-info

    • 图文混排/视频文字混排中的媒体卡片

  4. 信源引用

    • data-reference

    • 统一信源列表(web / document / image / video)

  5. 行内引用

    • data-document-ref

    • Perplexity 风格行内文档引用

  6. 模板视频

    • data-template-video

    • AV 模板化 agent 输出的视频卡片

  7. 模板分析

    • data-video-info / data-template-info / data-template-video-content

    • AV 模板化 agent 的分析结果数据

    • "语音转录""视频纲要""视频转脚本"等表格型模板通过 data-template-video-content 一次性下发

  8. 流式 JSON

    • json-start / json-delta / json-end

    • 增量 delta-only JSON 流式协议

    • 用于"动作表达"等结构化 JSON 模板输出分析结果

start

data

object

协议数据

errorCode

string

见错误码列表说明

400

errorText

string

见错误码列表说明

参数错误

id

string

唯一标识,如多段文本,使用不同的 id,文本内一致

2a127bc9-9474-405d-916d-8bc4475fa459

retryable

boolean

错误是否可重试,默认 true

true

type

string

同 event

data

string

负责结构回复数据

{

"items": [

{

"title": "电脑产品评测",

"videoUrl": "https://video.example.com/review.mp4",

"coverUrl": "https://images.example",

"tags": [

"数码产品",

"评测",

"电脑",

"生产力"

]

}

]

}

delta

string

增量文本输出

如果你想更快看到上身效果,这 3 条短视频会更直观。\n\n**第一条:完整通勤 look**\n\n3 套通勤到周末无缝切换的浅色运动鞋穿搭。

finishReason

string

完成原因,当取值为 stop 时表示输出结束;错误时,输出为错误原因。

stop

requestId

string

请求 id

2a127bc9-9474-405d-916d-8bc4475fa459

id

string

请求 id,同 requestId

2a127bc9-9474-405d-916d-8bc4475fa459

响应以 SSE 流形式逐帧推送,每帧为一个 JSON 对象,必须包含 type 字段标识当前数据块类型。

数据块类型总览

类型分类

数据块类型

说明

消息开始和结束

startfinish

标记消息的开始和结束

文本流式回复

text-starttext-deltatext-end

Markdown 文本流式输出

图文视频混排回复

data-image-infodata-video-ref

图文混排/视频文字混排中的媒体卡片

视频问答应用回复(模板输出型)

data-template-infodata-template-video-content

AV 模板化 agent 输出的视频卡片

回复信源引用

data-reference

统一信源列表(document/image/video)

消息开始和结束

完整的消息生命周期遵循以下顺序:

start → 内容块(可多个,可交替) → finish

步骤说明:

  1. start:消息开始,携带 messageId

  2. 内容块(text-*data-* 等,可多个、可交替)。

  3. finish:消息结束,携带 finishReason

消息开始start

标记一条新的消息开始。

参数名

类型

是否必填

说明

type

string

固定值 start

messageId

string

消息唯一标识

消息结束 finish

标记消息结束,携带完成原因。

参数名

类型

是否必填

说明

type

string

固定值 finish

finishReason

string

结束原因,例如 stop(正常结束)、error(异常结束)

文本流式回复

文本内容输出采用流式分块输出,一个完整的文本段落由 text-start → 若干 text-delta → text-end 组成。多个文本块可与媒体块交替出现,实现图文混排或视频文字混排。

  1. text-start:标记文本块开始,携带该文本块的唯一 id

  2. text-delta:推送增量文本内容,同一 id 可多次出现,客户端按顺序拼接。

  3. text-end:标记文本块结束。

text-start

标记一个文本块开始。

参数名

类型

是否必填

说明

type

string

固定值 text-start

id

string

文本块唯一标识

text-delta

文本增量内容,支持 Markdown 格式。同一文本块可多次推送 text-delta,客户端按顺序拼接。

参数名

类型

是否必填

说明

type

string

固定值 text-delta

id

string

所属文本块标识

delta

string

本次增量 Markdown 文本内容

text-end

标记一个文本块结束。

参数名

类型

是否必填

说明

type

string

固定值 text-end

id

string

所属文本块标识

图文视频混排

文本块与媒体块可交替输出,形成混排效果。典型顺序为:

text-start → text-delta → text-end → data-image-info → text-start → text-delta → text-end → data-video-info → ...

图文混排问答回复 data-image-info

说明:图文混排中的内联图片卡片,穿插在文本块之间。

参数名

类型

是否必填

说明

type

String

固定值 "data-image-info"

data

Object

图片数据对象

├─ id

String

图片唯一 ID

├─ imageUrl

String

图片 URL

└─ name

String

图片名称/标题

视频文本混排问答回复 data-video-ref

说明:视频文字混排中的内联视频卡片,穿插在文本块之间。

参数名

类型

是否必填

说明

type

String

固定值 "data-video-ref"

data

Object

视频数据对象

├─ id

String

视频/片段唯一 ID

├─videoId

String

视频唯一 ID

├─videoType

String

segment-片段,raw-视频

├─ videoUrl

String

视频/片段 URL

├─ name

String

视频名称/标题

├─fullVideoUrl

String

完整视频URL

├─start

String

片段开始时间

├─end

String

片段结束时间

└─ coverUrl

String

视频封面图 URL

视频问答应用(模板输出型)回复

模板类型

模板名称

输出格式

平台模板

动作表达、赛事高光、知识要点

流式Json

视频纲要、视频转脚本、语音转录

结构化Json输出

剧情理解、会议纪要

MarkDown

自定义模板

自定义模板

默认Markdown输出,可按需调整配置

视频信息 data-video-info

参数名

类型

是否必填

说明

type

String

固定值 "data-template-video"

data

Object

视频信息数据对象

├─ coverUrl

string

视频封面图片地址

├─ keywords

string

视频关键词标签(逗号分隔)

├─ videoUrl

string

视频文件原始地址

├─ sourceType

string

内容来源类型(固定值"video")

├─ videoType

string

视频存储类型(raw表示原始视频)

├─ name

string

视频文件名称

└─ id

string

视频资源唯一标识(视频ID)

平台模板信息data-template-info

平台预指模板包含:

参数名

类型

是否必填

说明

type

String

固定值 "data-template-info"

data

Object

数据对象

└─ templateName

string

模板名称,例如"视频转脚本"

└─ templateId

string

模板id,例如:"tpl-3"。如果是自定义模板,模板id"custom"

自定义模板data-template-video-content

参数名

类型

是否必填

说明

type

String

固定值 "data-template-video-content"

data

Object

自定义结构数据对象

├─ header

Object

表头定义,Record<string, string> 类型,key 为列标识,value 为列显示名,例如 {"content_summary": "内容概要"}

└─ list

Array[Object]

具体内容,每行为开放式键值对([key: string]: string | number),可按 header 动态渲染。不同模板会启用不同的字段子集

常见list字段如下:

参数名

类型

是否必填

说明

start

number

片段起始时间(秒)

end

number

片段结束时间(秒)

title

string

段落标题(视频纲要模板 tpl-2

summary

string

段落摘要(视频纲要模板 tpl-2

content_summary

string

内容摘要(视频转脚本等模板)

transcription

string

转录文本(语音转录模板)

director_prompt

string

导演提示词(视频转脚本模板)

shot_size

string

景别:远 / 中 / 近 / 特写等

remarks

string

备注

注:header 的 key 与 list[ ] 行中的 key 一一对应(例如「视频纲要」模板的 header 为 { start, end, title, summary })。具体字段由后端模板决定,上表仅列出常见字段。

流式 JSON 类

模板化 agent 场景下,分析结果以 JSON 字符串的形式增量流式下发(delta-only 协议)。一段完整的 JSON 由 json-start → 若干 json-deltajson-end 三个独立事件组成,三个事件共享同一个 id;前端按出现顺序拼接各 delta 即可还原完整 JSON 字符串,再自行 JSON.parse

输出开始json-start

标记一段流式 JSON 开始。

参数名

类型

是否必填

说明

type

string

固定值 json-start

id

string

JSON 段唯一标识

输出增量json-delta

JSON 增量字符串片段,同一 id 可多次推送,客户端按顺序拼接。

参数名

类型

是否必填

说明

type

string

固定值 json-delta

id

string

所属 JSON 段标识

delta

string

本次增量 JSON 字符串片段

输出结束json-end

标记一段流式 JSON 结束。此时前端应将累积字符串作为完整 JSON 进行解析。

参数名

类型

是否必填

说明

type

string

固定值 json-end

id

string

所属 JSON 段标识

注:idtype 字段均直接平铺在事件顶层(与 text-* 协议一致), 嵌套在 data 字段中。
视频模板适用性评估 JSON 结构

在问答-模板化输出 agent 场景下,若当前视频画不适用该模板json-* 流拼接出的完整 JSON 为对应模板的结构化分析结果。JSON 的最外层 schema 由命中的 templateId 决定(参见前文 data-template-info),常见结构示例如下:

通用字段:

参数名

类型

是否必填

说明

applicable

boolean

当前视频是否适用于该模板;为 false 时其余业务字段可空

content_type

string

模板判定出的内容大类,例如 "电影/电视剧表演段落"

示例:「动作表达」模板(templateId = tpl-8

参数名

类型

是否必填

说明

actions

array

按时间顺序排列的动作片段数组

actions[ ] 元素:

参数名

类型

是否必填

说明

start

number

片段起始时间(秒)

end

number

片段结束时间(秒)

subject

string

动作主体,例如 "警官""老妇人"

action

string

动作描述(肢体/表情/行为)

intensity

string

动作/情绪强度,例如 "强硬、严肃""绝望、恐惧"

context

string

场景语境与镜头/情感说明

注:不同模板会对应不同的 JSON schema(如「知识要点」「会议纪要」等会使用其他字段)。上表仅示例「动作表达」模板。可根据 data-template-info.templateId 动态选择解析结构。

回复信源引用

data-reference

参数名

类型

是否必填

说明

type

String

固定值 "data-reference"

data

Object

数据对象

└─ items

Array[Object]

信源项数组(见下方子类型)

️ items[] 中每个元素根据 sourceType 不同,结构如下:


当引用对象为文档时sourceType = "document"

参数名

类型

是否必填

说明

sourceType

String

固定值 "document"

fileName

String

来源文件名称

fileType

String

文件格式(pdf/docx/txt/md/url等)

chunkContent

String

检索片段内容

score

Number

检索得分


当引用对象为图片时 sourceType = "image" 

参数名

类型

是否必填

说明

sourceType

String

固定值 "image"

datasetName

String

来源图片数据集名称

thumbnailUrl

String

缩略图 URL

imageUrl

String

图片原始 URL


当引用对象为视频片段时 sourceType = "video"

参数名

类型

是否必填

说明

sourceType

String

固定值 "video"

videoSource

String

Video source 名称

videoUrl

String

视频 URL

clipTimeRange

String

片段时间范围(如 "01:23-02:45")

返回示例

正常返回示例

JSON格式

图片问答响应

以下为图片问答应用内流式输出,且图片文本混排的示例

  data: {"type":"start","messageId":"msg-001"}

  data: {"type":"text-start","id":"text-1"}

  data: {"type":"text-delta","id":"text-1","delta":"按风格选:轻运动 VS 日常休闲\n\n"}

  data: {"type":"text-delta","id":"text-1","delta":"**轻运动款** —— 活力感与舒适感兼顾"}

  data: {"type":"text-end","id":"text-1"}
  
  data: {"type":"data-image-info","data":{"id":"img-001","imageUrl":"https://cdn.example.com/i1.jpg","name":"轻运动款 - 拼接运动鞋"}}

  data: {"type":"text-start","id":"text-2"}
  
  data: {"type":"text-delta","id":"text-2","delta":"**日常休闲款** —— 简洁耐看更百搭"}

  data: {"type":"text-end","id":"text-2"}

  data: {"type":"data-image-info","data":{"id":"img-002","imageUrl":"https://cdn.example.com/i2.jpg","name":"日常休闲款 - 纯色休闲鞋"}}

  data: {"type":"data-reference","data":{"items":[
    {"sourceType":"document","fileName":"运动鞋舒适度评测报告.docx","fileType":"docx","chunkContent":"在中端价位段中,轻量透气材质逐渐成为主流...","score":0.87},
    {"sourceType":"image","datasetName":"商品图片数据集","thumbnailUrl":"https://cdn.example.com/i2-thumb.jpg","imageUrl":"https://cdn.example.com/i2.jpg"}
  ]}}

  data: {"type":"finish","finishReason":"stop"}

视频问答响应(视频文字混排)

以下为视频问答应用(对话型)内流式输出,且视频文本混排的示例

data:{"id":"mock-session-001","type":"start","requestId":"mock-request-001"}

data:{"id":"text-block-001","type":"text-start","requestId":"mock-request-001"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"视频中"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"展示了"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"悬挂"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"的"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"装饰"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"摆件"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":",并通过"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"特写"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"镜头"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"展示"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"其"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"纹理"}

data:{"id":"text-block-001","type":"text-delta","requestId":"mock-request-001","delta":"细节"}

data:{"id":"text-block-001","type":"text-end","requestId":"mock-request-001"}

data:{"id":"video-ref-001","type":"data-video-ref","requestId":"mock-request-001","data":{"coverUrl":"https://.../cover_frame.jpg?Expires=...","videoUrl":"https://.../demo_video.mp4?Expires=...","sourceType":"video","name":"sample_video.mp4","start":"0.00","datasetId":"DATASET_001","end":"10.00","id":"video-001"}}

data:{"id":"text-block-002","type":"text-start","requestId":"mock-request-001"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"。为了"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"展示"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"使用"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"效果"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":",画面"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"演示了"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"该"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"摆件"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"在"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"室内"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"与"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"桌面"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"场景"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"中的"}

data:{"id":"text-block-002","type":"text-delta","requestId":"mock-request-001","delta":"摆放"}

data:{"id":"text-block-002","type":"text-end","requestId":"mock-request-001"}

data:{"id":"video-ref-002","type":"data-video-ref","requestId":"mock-request-001","data":{"coverUrl":"https://.../cover_frame_02.jpg?Expires=...","videoUrl":"https://.../demo_video.mp4?Expires=...","sourceType":"video","name":"sample_video.mp4","start":"10.00","datasetId":"DATASET_001","end":"20.00","id":"video-001"}}

data:{"id":"text-block-003","type":"text-start","requestId":"mock-request-001"}

data:{"id":"text-block-003","type":"text-delta","requestId":"mock-request-001","delta":"。"}

data:{"id":"text-block-003","type":"text-end","requestId":"mock-request-001"}

data:{"id":"reference-001","type":"data-reference","requestId":"mock-request-001","data":{"items":[{"coverUrl":"https://.../cover_frame.jpg?Expires=...","videoUrl":"https://.../demo_video.mp4?Expires=...","sourceType":"video","name":"sample_video.mp4","start":"10.00","datasetId":"DATASET_001","end":"20.00","id":"video-001"}]}}

data:{"id":"mock-session-001","type":"finish","requestId":"mock-request-001","finishReason":"stop"}

视频模板响应

以下为问答应用(模板输出型)内不同类型模板的输出示例

流式Json类(动作表达、赛事高光、知识要点)
id:mock-msg-default-001
event:start
data:{"id":"mock-msg-default-001","type":"start","requestId":"mock-request-001"}

id:mock-video-info-001
event:data-video-info
data:{"id":"mock-video-info-001","type":"data-video-info","requestId":"mock-request-001","data":{"coverUrl":"https://example.com/mock/cover.jpg","keywords":"团队协作,产品演示,用户体验,功能亮点","videoUrl":"https://example.com/mock/video.mp4","sourceType":"video","videoType":"raw","name":"demo-video.mp4","id":"mock-video-id-001"}}

id:mock-template-info-001
event:data-template-info
data:{"id":"mock-template-info-001","type":"data-template-info","requestId":"mock-request-001","data":{"templateName":"动作表达","templateId":"tpl-demo-001"}}

id:mock-json-stream-001
event:json-start
data:{"id":"mock-json-stream-001","type":"json-start","requestId":"mock-request-001"}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"{"}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n  \"applicable\": true,"}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n  \"content_type\": \"产品演示片段\","}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n  \"actions\": ["}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n    {"}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n      \"start\": 0.0,"}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n      \"end\": 10.0,"}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n      \"subject\": \"演示人员\","}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n      \"action\": \"走向展示区并介绍核心功能\","}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n      \"intensity\": \"自然、清晰\","}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n      \"context\": \"通过稳定讲解帮助观众理解产品亮点\""}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n    }"}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n  ]"}

id:mock-json-stream-001
event:json-delta
data:{"id":"mock-json-stream-001","type":"json-delta","requestId":"mock-request-001","delta":"\n}"}

id:mock-json-stream-001
event:json-end
data:{"id":"mock-json-stream-001","type":"json-end","requestId":"mock-request-001"}
结构化Json输出(视频纲要、视频转脚本、语音转录)
id:mock-start-001
event:start
data:{"id":"mock-start-001","type":"start","requestId":"mock-request-001"}

id:video-info-001
event:data-video-info
data:{"id":"video-info-001","type":"data-video-info","requestId":"mock-request-001","data":{"coverUrl":"https://.../cover_frame.jpg?Expires=...","keywords":"人物交流,活动现场,生活分享,轻松互动","videoUrl":"https://.../sample_video.mp4?Expires=...","sourceType":"video","videoType":"raw","name":"sample_video.mp4","id":"VIDEO_ID_001"}}

id:template-info-001
event:data-template-info
data:{"id":"template-info-001","type":"data-template-info","requestId":"mock-request-001","data":{"templateName":"视频转脚本","templateId":"tpl-demo-001"}}

id:template-content-001
event:data-template-video-content
data:{"id":"template-content-001","type":"data-template-video-content","requestId":"mock-request-001","data":{"header":{"shot_size":"景别","director_prompt":"导演提示","content_summary":"内容概要","transcription":"转录","remarks":"备注","start":"开始时间","end":"结束时间"},"list":[

  {"content_summary":"几位年轻人在户外活动现场边走边交流。","transcription":"男声介绍活动安排,语气轻松自然,背景伴有现场环境声。","director_prompt":"跟随人物移动后切换正面镜头","shot_size":"中景","start":0.0,"end":10.0,"remarks":"场景光线自然,周围人群氛围轻松愉快。"},

  {"content_summary":"主持人在室内活动现场向观众介绍流程。","transcription":"男声说明接下来的互动环节,语气平稳且具有节奏感。","director_prompt":"缓慢推进","shot_size":"中景","start":10.0,"end":20.0,"remarks":"画面色调温暖,观众神情专注,现场布置整洁明亮。"},

  {"content_summary":"一位长者在室内与年轻人进行交流。","transcription":"长者语气温和,分享自己的生活经验与建议。","director_prompt":"缓慢推进","shot_size":"中景","start":20.0,"end":30.0,"remarks":"场景色调偏暖,人物互动自然。"},

]}}

id:mock-start-001
event:finish
data:{"id":"mock-start-001","type":"finish","requestId":"mock-request-001","finishReason":"stop"}
Markdown格式(剧情理解、会议纪要、自定义模板)
data: {"type":"start","messageId":"mock-msg-default-001"}

data: {"type":"start-step"}

data: {"type":"data-template-info","data":{"items":[{"title":"MacBook Neo 深度测评:全面超越,最轻盈的生产力","videoUrl":"https://video.example.com/macbook-neo-review.mp4","coverUrl":"https://images.unsplash.com/photo-1529139574466-a303027c1d8b?auto=format&fit=crop&w=800&q=80","tags":["数码产品","评测","MacBook","生产力"]}]}}

data: {"id":"b43b71c8-dcf0-4597-b1e8-3b7b7599f73e","type":"data-template-info","requestId":"1e78148a17782391368705400d119a","data":{"templateName":"视频转脚本","templateId":"tpl-3"}}

data: {"type":"text-start","id":"text-video-summary-001"}

data: {"type":"text-delta","id":"text-video-summary-001","delta":"## 视频内容总结\n\n### 1. MacBook Neo 深度测评\n\n- **核心亮点**:全新 M4 Ultra 芯片,单核性能提升 32%,整机重量仅 1.24kg\n- **续航表现**:视频播放续航达 22 小时,日常办公可撑满两个工作日\n- **不足之处**:接口仍为 3 个 USB-C,缺少 SD 卡槽\n\n> 适合人群:追求轻薄便携的创意工作者"}

data: {"type":"text-end","id":"text-video-summary-001"}

data: {"type":"finish-step"}

data: {"type":"finish","finishReason":"stop"}

拒答返回示例

JSON格式

data: {"type":"start","messageId":"mock-msg-default-001"}

data: {"type":"text-start","id":"text-default-part1"}

data: {"type":"text-delta","id":"text-default-part1","delta":"抱歉,这个话题超出了我的回答范围,有其他问题请随时问我。"}

data: {"type":"text-end","id":"text-default-part1"}

data: {"type":"finish","finishReason":"stop"}

错误码

HTTP状态码

错误码

错误message

说明

401

APP_ID_REQUIRED

appId is required

缺少应用 ID

402

INVALID_ROLE

message role must be user

消息角色无效

403

APP_NOT_FOUND

app not found

应用不存在

404

INPUT_TOO_LONG

input text exceeds maximum length

文本输入内容太长,超出最大长度(1024字符)限制

405

IMAGE_LIMIT_EXCEEDED

image count exceeds maximum limit

上传图片数量超过5张上限

500

SYSTEM_ERROR

system error

系统错误

700

FORBIDDEN

no permission to access this app

没有权限访问该应用

搜索结果中多媒体资源(图片、视频)URL获取预签名 API

如需获取数据集内数据url链接并进行下载,请参考搜索结果中多媒体资源(图片、视频)URL获取预签名 API