具身智能视频泛化-云原生数据仓库AnalyticDB(AnalyticDB)-阿里云帮助中心

文档备案控制台

面向机器人、自动驾驶、具身智能模型训练等需要大规模合成视频数据的场景，提供从源素材入库到批量生产、质量评测、数据集导出的一体化工厂能力。

控制台布局

进入具身智能 · 训练数据工厂后，左侧导航包含 6 个入口：

入口	功能
快速生成	单次生成训练视频
生产项目	数据集管理：源素材、生产配置、执行状态、产出、导出
质量评测	评分仪表盘、评分方案管理、快速试用评测
存储审计	跨数据集的存储与文件审计
API	通过 REST API 集成到自动化流水线
设置	训练数据工厂相关设置

生产项目

创建项目

进入生产项目页面，点击新建项目。
填写名称、描述，并按需选填：机器人型号、任务类型、环境、来源类型。
创建后会自动进入项目工作台。

项目工作台

步骤	功能
源素材	上传源视频与参考图，分类查看
生产配置	表单或 JSON 高级模式批量配置生产任务
执行状态	查看本项目内所有生产任务的进度
产出	浏览本项目产出的训练数据条目
导出	一键导出整个数据集（包含元信息与文件）

源素材上传

支持视频（MP4 / MOV / WebM）与图片（JPG / PNG / WebP）。
单个视频最大 500 MB，单张图片最大 100 MB。
上传时显示批量进度条，失败可重试。
已上传素材会归档到当前数据集，可继续在生产配置中复用。

生产配置

提供两种模式：

表单配置：勾选源视频，对每个视频独立配置 Prompt 与挂载参考图，适合直观操作。
JSON 高级：通过 JSON 一次性提交批量任务，适合熟悉脚本的高级用户。

执行状态

执行状态页面以批次为单位呈现：

总进度、成功 / 失败 / 进行中数量。
每个任务的实时进度、阶段标签。
失败任务可一键重试。

产出与条目详情

产出列表支持：

按质检状态筛选：待评估、自动通过、自动不通过、已确认、已推翻、已跳过。
按来源类型筛选：采集、切片、生成、拼接。
按文本关键词搜索。
点击单条进入详情页：标签、生成提示词、视频预览、元信息（时长、分辨率、帧率、来源任务）、血缘链（追溯父级条目）。

数据集导出

一键导出整个数据集为打包文件（含视频与元信息）。
支持按质检态过滤导出（例如仅导出“已确认”条目）。
导出任务异步执行，可在导出 Tab 查看进度并下载结果。

质量评测

评测总览

累计评测数、通过率、各维度达标率。
可视化柱状图直观对比维度表现。

评分方案

内置系统评分方案，多个维度（如语义一致性、运动一致性、画面稳定性、外观保留、轨迹合理性、物理合理性等）均按 0–2 评分。
可查看维度详情、判断标准与通过门槛。
多套方案可切换，设为默认后所有新任务都将使用该方案。

快速试用

在快速试用区域填入待评测视频 URL（与可选源视频 URL）。
点击开始评测，几十秒内得到评分结果。
评测结果包含每个维度得分与综合通过结论，可作为方案对比参考。

API

通过 REST API 将训练数据生成能力集成到您的自动化流水线。

API 页面中提供了核心接口清单，包括上传文件、提交生成任务、查询任务状态、清理任务文件等，可以直接在页面中发起 API 调用。另外也提供了快速开始的 Python 示例，便于开发集成。

存储审计

存储审计模块跨数据集统计：

OSS 文件总占用、孤立文件、可清理对象。
支持安全清理操作。

上一篇：AI 编剧助手下一篇：AI视频创作

该文章对您有帮助吗？