2D视频数字人形象定制指南

重要

本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。

该拍摄指南详细介绍了数字人形象定制的视频拍摄指导。请您提前完整阅读,了解在设备选择、场地要求、模特形象、录制过程和最终的视频处理上的具体要求,以保障定制效果符合您的预期。

一、拍摄须知

  • 拍摄规格:视频总时长5分钟,视频大小需小于20G,分辨率为1080P及以上(推荐4K),帧率为30fps及以上,保留音画同步的原声。

  • 拍摄前需明确本次拍摄的数字人形象后续的使用场景,并依据场景特性引导模特设计动作与神态 ,即模特的整体表现需与未来应用场景高度贴合。

    • 例如,若用于知识类口播短视频制作,模态状态应松弛自然,语调平缓亲和,如同面对面交流般流畅;若面向直播带货场景,则需展现出热情饱满的状态,配合手势强调产品亮点,眼神富有感染力以拉近与观众的距离。

  • 用于训练的数字人拍摄素材,将直接决定最终的训练效果,训练完成后的数字人会1:1还原素材里的细节,人物的表情神态、肢体手势、眼神流转等细节都会与素材保持高度同步,仅有口型是基于原有素材的说话习惯由AI生成的。因此,拍摄过程中务必做好模特的引导工作,才能确保最终效果精准达标。

二、录制片段说明

  • 确定数字人的使用场景,根据不同场景的录制要求进行录制,目前平台提供「视频制作」和「实时对话」两种场景

  • 视频制作场景:15秒静默+4~5分钟口播

  • 实时对话场景:15秒静默+30~40秒左右无语义的动作+4~5分钟口播

  • 具体说明:

    • 静默片段:开机后模特先静默约15秒,手放置于身前,唇部自然闭合,保持直视镜秒头,可眨眼,不要张嘴或做其他面部手部动作。

    • image.png

    • 4~5分钟口播:开始滚动提词器,模特直视镜头录制口播视频,要求吐字清晰。口播过程中模特的面部表情、头部及手部的自然动作可根据最终合成视频需要进行设计。口播过程中停顿处嘴唇保持闭合。

    • 30~40秒左右无语义的动作(仅实时对话数字人需要):不要张嘴(唇部自然闭合),身体可以有轻微动作,既可以表现聆听也可以用于表现说话,身体可以略有动作。具体肢体动作需要结合具体应用场景中的实时交互的场景(企业宣传、在线教育等)来做针对性设计。

  • 拍摄注意事项:

    • 口播视频拍摄过程中,如果讲错词了,可以直接忽略继续从错误位置开始讲,不要惊慌,不要打断拍摄。

    • 避免头部运动大幅度和频率运动(左右转动、上下点头),不可超过15度。

    • 避免脸部、颈部遮挡,比如抬手动作、托腮动作。

    • 避免舔嘴、吐舌、噘嘴及其他面部夸张表情。

    • 避免有明确指代性意义的动作(比如摇头否定、摇手打招呼、摊手无奈等)。

    • 避免视线离开镜头。

三、录制前准备

3.1 场地说明

  • 选择无噪声的拍摄场地,尤其注意避开拍摄当天周围有施工计划的环境,拍摄的时候现场不要有其他的声音,如果需要同步训练视频素材中的音频,请对音频做降噪处理,保证模特声音清晰,无杂音干扰、无背景音。

  • 确保灯光设备光线均匀、亮度充足,无阴影、不过曝,录制过程中不发生显著变化。如是绿幕拍摄,请确保演员与绿幕背景之间无阴影及反光,演员脸上切忌残留绿光,这会对后期的抠图造成比较大的困难,且处理不好会直接导致无法训练。

  • 拍摄背景说明

    • 如后期需要叠加背景使用,则需要提供抠图后的视频,拍摄时请使用绿幕作为背景录制,并确保绿幕平整颜色均匀无褶皱。模特背后距离绿幕>2.5米为佳,避免出现阴影。注意如需拍摄全身,地面也需要铺设绿幕。

    • 如后期要使用实拍背景,拍摄时请用实景录制,确保背景静止、没有真人或拟真人像,以免影响最终生成效果。

image.png

3.2 设备要求

  • 选择一款可拍摄分辨率1080P及以上、帧率30FPS及以上视频的手机或摄像机。

  • 手机或摄像机使用专业三脚架或手机支架固定,关闭自动对焦功能,确保拍摄画面稳定、不失焦、无抖动,避免使用超广角,相机与人物眼神平齐。

  • 如使用摄像机,配套安装PAD提词或专业提词器设备;如使用手机,下载提词器软件。确保录制过程中模特目光可直视镜头。

  • 收音设备建议使用带有降噪功能的专业麦克风,这会减少环境中噪音的干扰。请注意在拍摄的时候,做好麦克风的隐藏,不要出画。

3.3 模特

  • 模特服装保持整洁,避免挑选反光、半透明、透光材质的服饰和配饰、避免绿色服饰和配饰、避免带人脸的服饰、避免高领毛衣、避免过多褶皱、避免条纹密集的衣服、以免增加抠图难度。

  • 模特发型规整、切勿遮挡面部五官和脖颈,保证无法通过头发缝隙看到背景,必要时使用发胶等固定碎发,以免增加抠图难度。

  • 模特妆容干净、无油光。如需佩戴眼镜尽量选择隐形或小框镜,拍摄时避免镜面反光。

image.png

  • 模特在拍摄前需熟读口播文稿(约1500字),避免拍摄时频繁卡壳。模特可使用平台样例文稿:(可见文末「附录」),也可使用自己熟悉的文稿。需确保现场拍摄的文稿内容不重复、可支持正常语速连续口播5分钟以上。

四、录制过程

4.1 试拍测试

  • 正式开机前,试拍一段。确保:

    • 画面——模特在画面中比例合适,目光平视、不俯仰、不偏斜,五官清晰、如需做手部动作不出画面。

    • 提词——提词器播放速度与模特语速统一,保持提词器和镜头在同一位置,避免眼睛乱瞟。

    • 声音——底噪低、声音清晰、音画同步。

    • 表现力——模特拍摄状态正式、自然,表情动作不僵硬。

    • 姿势——根据数字人使用场景做选择。比如播报数字人,可以采用坐姿,比如对话数字人,可以采用全身或半身站姿。

4.2 正式拍摄

  • 确保现场安静、无关人员清场后即可正式开拍。拍摄过程预计5-10分钟,注意需一镜到底,中间不允许暂停或后期剪辑。

  • 按照上文中「录制片段说明」中的要求进行拍摄,最终训练出的数字人形象的面部表情与动作将与口播视频完全一致,请务必确保高质量拍摄。

五、录制后处理

  • 如果拍摄过程中视频模特存在位置移动,需确保人工剪辑掉不可用部分后提交(注意!中间不允许剪辑)。

  • 如果希望数字人最终可叠加任意背景图输出视频结果,在采用绿幕作为背景录制完成后,需自行抠除底色,抠图要求如下:

    • 不建议完全依赖自动抠图,包括各种工具、SDK、API、网页工具等。如果使用自动抠图工具,务必在使用之后进行人工检查和修正。自动抠图可能存在的问题包括但不限于抠多抠少、边缘毛刺、视频清晰度降低等。需要确保:

      • 抠图的边缘应该清晰、平滑、 前背景完全分离。

      • 抠图的透明通道(又叫alpha通道),不含半透明。 即前景全部为白色(255)、背景全部为黑色(0)。 人物边缘,例如头发处,也尽量减少中间的半透明值。

      • 抠图的结果,帧之间保持画面连续, 即在播放时,边缘不出现某一帧多一块、前后帧少一块的闪烁现象(通常出现在全自动抠图中)。

      • 按需调整色调。 如果您拍摄的绿幕视频,模特面部、身体绿色反光严重,抠图后需自行进行色调修正处理。

      • 亮度调整。确保模特的亮度匹配后续需要使用背景图,确保形象与背景图叠加后,光照统一,视觉效果和谐。一旦素材进入训练,亮度光照都将保持和提交的素材一致。

      • 抠图完成后,为确保效果无误,请在上传前通过视频编辑软件叠加纯色(浅色、红色、深色,建议都进行尝试)背景图片确认抠图结果精准、符合要求。

  • 如噪声过大请自行导入视频编辑软件降噪后再上传。

  • 处理中不可使用瘦脸、大眼等影响脸型、五官的特效。导出时请关注码率等参数,保证导出视频的清晰度。

六、视频文件自检Checklist

警告

请在提交前逐项检查,确保提交的视频符合要求,否则将无法训练

视频文件-画面

检查项

是否满足

模特在视频中人头朝上方

模特始终表情姿态保持自然放松,不紧绷或僵硬

未出现除模特外的第二人脸(包括真人或其他物体上显示的人像)

模特身体及头部未进行大幅移动或大幅转动

模特头部、手部动作始终不出画面,手部动作始终不遮挡面部颈部

模特面部光照均匀、五官及人脸轮廓清晰、未被刘海或头发遮挡

模特眼神始终保持看向镜头,眨眼频率正常,无乱瞟或斜视情况

15秒模特静默时嘴唇闭合,面部表情自然

模特说话时不磕巴,口齿清晰、唇形自然、牙齿清晰,停顿时嘴唇闭合

无剪辑拼接画面,模特全程没有挪动位置,无明显跳帧情况

模特麦克风没有露出画面

无明显瘦脸、大眼等影响五官的特效

画面中不出现国旗、国徽、军旗、军徽等代表国家形象的元素。

如是抠图视频,请务必确保无多抠或误抠情况。请先在视频剪辑工具内叠加纯色背景,确保抠图边缘无颜色渐变,人物发丝处无过度抠图

七、提交材料清单

最终您需要在灵眸数字人控制台提交的文件为一个完整视频。

  • 训练视频的尺寸比例为横屏16∶9或竖屏9∶16,分辨率要求至少1080P,帧率为30 FPS,视频时长5分钟,大小不超过20GB。

  • 如后期需合成任意背景,需在创建时选择透明,且自行抠图后导出带透明通道的视频文件,支持WebMMOV两种格式。

    • 注意,mov必须是ProRes编码的,cfhd(CineForm HD)编码格式浏览器暂不兼容)

  • 如直接使用拍摄时的实景背景,导出不带透明通道的MP4格式视频文件上传即可。

附录-口播文档参考

样例1:故事解说类

今天,我们要跟您聊聊一部中国古典文学名著——《聊斋志异》。《聊斋志异》是清代文学家蒲松龄所著的一部奇幻小说集,收录了许多神鬼、妖怪和鬼怪的故事,引领了中国古典奇幻小说的发展。

《聊斋志异》中的故事不仅充满奇妙的想象力,而且也深刻地反映了清代社会的风貌和人民的生活。故事情节各异,颇有诙谐幽默之处,同时也不乏深刻的人生哲理和思考。

其中最著名的故事是《牡丹亭》。这个故事讲述了一个女子梦游花丛,与一位青年相遇,两人一见钟情,但最终无法在现实中相聚。这个故事被誉为中国古代文学史上的一部经典之作,反映的爱情主题极其深刻。作者通过描写梦境,创造出了一个虚幻的情境,使得美好的爱情镜像出来。对于每一个人来说,我们都有自己的梦境和幻想,梦中的情境往往更加美好,而现实往往是残酷的。《牡丹亭》中的爱情也是如此,两个人的相遇和相爱只是在梦中实现,但却让人们看到了爱情的真谛。

故事中的人物形象也十分鲜明而深具内涵。杜丽娘是一个富家女,却并不像其他富家女子那样,被金钱利益所驱使,她渴望爱情和美好的人生。柳梦梅则是一个苦读书生,为了实现自己的人生抱负,而在死后选择重生。他的选择不仅是为了自己的幸福,更是为了实现他对杜丽娘的爱情承诺。

而故事的结局更是充满了感人的情感,梦中的爱情无法在现实中实现,两个人也只能在梦里相聚,但他们的相遇和相恋却让人们看到了生命中最真挚的感情。不仅是爱情,作者还在故事中反响了家族荣辱、人生价值、生命的虚幻等多重主题。

总而言之,牡丹亭故事的精妙之处在于其通过一段虚幻的梦境,描绘了一个美好而真挚的爱情。故事中的人物形象鲜明、细腻,不仅是刻画了人物形象,更是对于生命的思考和对于爱情的追求。从中我们看到了作者对于人生与爱情的真挚追求,以及对于美好生命的信仰和追求。而正是这种精神内涵,让牡丹亭成为了一部极具文化价值和艺术价值的文学经典。

除此之外,《聊斋志异》中还有许多其他的精彩故事。比如《骆宾王与诸葛青虹》、《碧玉簪》、《画皮》等等。这些故事不仅令人惊叹于作者的奇想,更让我们感受到了中国传统文化的深厚底蕴和独特魅力。

作为一部古代文学名著,《聊斋志异》的价值不仅在于其故事情节,更在于其对中国文化的影响和传承。《聊斋志异》中的精神内涵和思想观念,不仅是中国古代文学的瑰宝,也是中华文化宝库中的珍贵财富。

随着时代的发展和社会的变迁,《聊斋志异》中的故事情节和思想意义也在不断演变和发展。它已经成为了一个具有多重文化意义和历史价值的文化符号,成为了中华文化的重要组成部分,也成为了世界文化交流的重要桥梁。

在这个信息爆炸的时代,我们不应该忘记中国传统文化的重要性。通过阅读《聊斋志异》,我们可以更深刻地了解中国传统文化的内涵和精髓,更好地感受中国文化的独特魅力。同时也能够帮助我们更好地认识和理解自己,更好地面对现代生活中的各种挑战和困境。

《聊斋志异》的影响力不仅止于中国国内,也在国际上产生了广泛的影响。许多翻译版本的《聊斋志异》已经出现在世界各地,让更多的人有机会欣赏到这部古代文学经典。它的故事情节和思想既与中国文化紧密相连,又具有普遍的人类价值,使得它能够跨越时空和文化的界限,打动着不同国家、不同民族的读者。

《聊斋志异》的影响还体现在中国文学创作中。许多当代作家受到《聊斋志异》的启发,创作了许多与之相关的作品。这些作品在保持传统魅力的同时,也注入了现代人的思考和情感,展现出了对于人性、社会问题和人生哲理的深入思考。

总之,《聊斋志异》作为一部具有重要文化价值的古代文学名著,通过其奇幻的故事和深刻的思考,向人们展示了中国传统文化的独特魅力和智慧。它不仅是古代文学的瑰宝,更是中华文化的重要组成部分。通过阅读和研究《聊斋志异》,我们可以更好地理解和传承中华文化,同时也能够从中获得心灵的滋养和启发。让我们珍惜这部伟大的文化遗产,让其继续发光发热,为人类文明的进步做出更大的贡献。谢谢收看本期文化节目,我们期待在下期节目中再次和您见面。

样例2:直播带货类

大家好,非常感谢大家对我们直播间的支持!今天我带来了一款专业的眼霜套装,它可以帮助你轻松解决眼部肌肤的各种问题。随着年龄的增长,眼部肌肤会出现细纹、黑眼圈、眼袋等问题,给我们的形象带来不小的困扰。因此,选择一款优质的眼霜套装,成为保护眼部肌肤的必要之选。

眼部肌肤是人体最脆弱的肌肤之一,也是最容易受到外界环境和内部因素的影响。因此,选择一款适合自己眼部肌肤需求的眼霜非常重要。今天我为大家推荐的这款眼霜套装,包含了两款不同功效的眼霜,分别针对眼部细纹和黑眼圈,让你的眼部肌肤变得更加年轻、明亮和有弹性。

首先,让我们来了解一下第一款眼霜。它富含天然植物精华和胶原蛋白,可以紧致眼部肌肤,淡化细纹和眼袋,同时还可以增强肌肤的弹性和光泽度。这款眼霜的质地轻盈、易吸收,使用起来非常的舒适。它能够迅速渗透到肌肤底层,提供长效滋养和修复,使眼部肌肤更加紧致、光滑,恢复青春活力。

接下来,我们来了解一下第二款眼霜。它专门针对黑眼圈而设计,内含多种天然植物萃取物,能够有效淡化黑眼圈和眼袋,让你的眼部肌肤变得更加明亮。同时,它还能够改善眼部血液循环,缓解眼部疲劳,让你的眼睛看起来更加有神。这款眼霜的质地清爽、不油腻,很适合日常使用。

这个眼霜套装不仅使用方便,而且效果显著,几乎每个人都能够轻松体验到它的神奇功效。如果你想让自己的眼部肌肤变得更加年轻、明亮和有弹性,那么这个眼霜套装绝对是你的最佳选择。

那么,我们来说一下,这款眼霜套装的适用人群。首先,对于那些因熬夜、工作压力大、长时间使用电子产品等原因而产生黑眼圈和眼袋的人群,这款眼霜套装是非常适用的。其次,对于那些因年龄增长而出现细纹和眼部松弛的人群,这款眼霜套装也是非常适用的。再次,对于那些想要预防眼部问题、保持眼部肌肤健康的人群,这款眼霜套装同样是非常适用的。

现在,让我们来分享一下这款眼霜套装的使用方法。首先,洁面后取适量眼霜,均匀地涂抹于眼部周围肌肤。特别是针对黑眼圈的眼霜,需要轻轻按摩至吸收。建议早晚各使用一次,坚持使用一个月以上,效果会更加显著。同时,需要注意的是,眼部肌肤非常娇嫩,使用眼霜的时候要轻柔、细致,尽量避免拉扯。

最后,我们来说一下这款眼霜套装的价格和购买方式。目前,我们的直播间享受全网最低价,这款眼霜套装仅售价198元,相比市面上其他品牌的眼霜套装,价格非常实惠。而且,在直播间下单还有额外的好处,前30位购买的宝宝将会获得小礼品的赠送,绝对是超值的购物体验。

我们非常明白,错过优惠活动的感觉非常不好,所以我们希望为大家提供详细的库存信息,让您在购买时可以做出明智的决策。截至目前,我们的套装库存非常有限,因为这些套装因其高品质和有效性而销售得非常快。所以,如果您一直在考虑购买,那么现在就是行动的时候了!不要再等待了,赶快将我们的护肤品套装加入购物车并结账,以享受优惠。

如果您有任何关于产品的疑问或需要咨询,我们的团队随时为您提供支持。您可以在直播间留言或者私信我们的工作人员,我们会尽快给予您详细的解答。

感谢大家收看今天的直播,希望我们的产品能够帮助您解决眼部肌肤问题,让您拥有年轻、明亮和有弹性的眼部肌肤。我们期待尽快为您发货,让您享受到优质的护肤体验。再次感谢大家的支持与关注!

样例3:在线教育类

欢迎来到知识乐园!今天我们要玩点超有趣的,你想先开启一场童话世界的奇妙冒险,还是探索藏在生活里的科学小秘密呀?

太好啦!我们这就出发!在遥远的梦幻森林里,住着会说话的小动物们。最近森林要举办 “语言大师争霸赛”,小鹦鹉、小喜鹊和小八哥都报名参加了。

哇!太厉害啦!小鹦鹉跟着你一说,马上就通过了!你简直是绕口令小达人!在你的帮助下,小动物们都进入了下一关 ——“故事创作”。要求用 “月亮”“星星”“小兔子” 编一个小故事,快发挥你的想象力吧!​

哇!这个故事太有趣啦!小动物们用你的故事征服了评委,成功拿到了 “语言大师” 的奖杯!冒险结束啦,是不是很有意思?现在,我们来探索一下生活中的小常识好不好?你知道为什么先看到闪电,后听到雷声吗?​

这是因为光的速度比声音的速度快很多哦!光在空气中每秒能跑约 30 万千米,而声音每秒只能跑 340 米左右。就像赛车比赛,光就是超级厉害的赛车手,“嗖” 地一下就冲出去好远;声音则像跑得比较慢的选手,要过一会儿才慢慢到达。所以打雷的时候,闪电的光一下子就传到我们眼睛里,但是雷声得慢悠悠地 “跑” 过来,这才让我们先看到闪电,后听到雷声,是不是很神奇?​

当然有!你知道为什么叶子会变黄吗?秋天到了,树叶里有一种叫叶绿素的东西会慢慢减少,而其他的色素,像黄色的叶黄素、橙色的胡萝卜素就显现出来啦。这就好比给树叶换衣服,叶绿素这件 “绿衣服” 慢慢脱掉,叶黄素和胡萝卜素这些 “黄衣服”“橙衣服” 就露出来了,所以叶子就变成黄色或者橙色,然后从树上飘落下来,就像给大地铺上了一层彩色的地毯!而且呀,不同的树,叶子变色的时间和颜色也不太一样哦,比如枫树的叶子到了秋天会变成火红火红的,特别漂亮!​

对呀!大自然里还有好多有趣的知识呢!你知道蜜蜂是怎么酿蜜的吗?蜜蜂会飞到花朵上,用它们像吸管一样的嘴巴吸取花蜜,存放在肚子里的蜜囊里。回到蜂巢后,它们把花蜜吐出来,和自己分泌的特殊液体混合,再通过扇动翅膀蒸发掉花蜜里的水分,慢慢地就酿成香甜的蜂蜜啦。其实蜜蜂可不只是会酿蜜,它们还会跳 “8 字舞” 呢!当一只蜜蜂发现了好的花丛,它就会回到蜂巢,跳起 “8 字舞”,告诉其他蜜蜂花丛的方向和距离,这样大家就能一起去采蜜啦!​

是呀!那我们再来玩个 “猜谜语” 游戏吧!“身穿绿衣裳,肚里水汪汪,生的子儿多,个个黑脸膛”,猜猜这是什么水果?​

哇!猜对啦!太厉害啦!我们继续探索有趣的知识,你知道为什么星星会一闪一闪的吗?其实星星本身不会一闪一闪,是因为地球的大气层不均匀,星星的光穿过大气层的时候,会被这些不均匀的空气干扰,一会儿被折射到这边,一会儿被折射到那边。这就好像我们在水里看东西会变形一样,星星的光在大气层里 “走” 的时候也变得忽明忽暗,所以我们在地球上看星星,就感觉它们在一闪一闪的,像在眨眼睛一样!而且呀,天上的星星数量超级多,科学家估计,仅仅在我们所在的银河系里,就有几千亿颗星星呢!​

很多有趣的现象背后都藏着科学知识哦!那你知道为什么向日葵总是跟着太阳转吗?向日葵的茎部有一种生长素,它特别怕光。所以太阳出来的时候,生长素就会跑到向日葵背光的一面,让背光面的茎长得快一些,这样向日葵的花盘就会朝着太阳的方向转啦。不过呀,向日葵并不是一直跟着太阳转,当它开花结果以后,就不再 “追” 着太阳了,而是慢慢固定下来,等着果实成熟。​

没问题!你知道吗?世界上最大的哺乳动物是蓝鲸,它的身体能有 30 米长,差不多有 10 层楼那么高!而且它的心脏就和小汽车一样大,小朋友在里面都能爬来爬去呢!还有,你听说过灯塔水母吗?这可是一种 “长生不老” 的生物哦!当它受到伤害或者环境不好的时候,就会重新变回小时候的样子,然后再慢慢长大,不停地重复这个过程,理论上它可以一直这样循环,不会真正死亡,是不是特别不可思议?接下来我们还可以玩更多好玩的游戏,探索更多有趣的知识,你想继续玩 “成语接龙”,还是听我讲一个关于宇宙的故事呀?

FAQ

  1. 如果我的设备只能拍摄低分辨率1080P的视频,怎么办?

答:如果设备的分辨率较低,可以尽量拍摄半身或者坐姿视频,保证人脸在画面中的占比尽可能的大,以获得更好的训练效果。

  1. 是否可以用手机拍摄?

答:尽量去使用摄像机拍摄。如果您的手边仅有手机可用,请将手机录制规格调整为4K、30fps4K、60fps,并用支架保证手机的稳定性,切忌手持拍摄。

  1. 如果拍摄过程中,有其他的人声,我是否需要重新拍摄?

答:需要,需要确保提供的训练素材中,不可以有三方人声,这会影响训练出的数字人口型。