2D数字人实时互动操作手册

一、登录

登录磐曦智创平台:https://imarketing.console.aliyun.com/

选择2D数字人>AI实时互动进入

image

二、权限管理

主账号设置管理员和普通用户身份,并给对应账号配置模型权限、数据权限、功能权限。

image

1.普通用户权限:管理员可对普通用户授权可用的私模形象和声音,并查看每个普通用户当前已授权的可用形象和声音数量。

image

2.管理员权限:

  • 数据权限:可设置管理员账号下产生的数据是否对其他账号可见可使用,包括项目、数字人协议、素材/贴纸/背景、画面模板、知识库、智能体是否与所有普通用户共享,普通用户相互之间产生的数据是独立隔离的。

  • 功能权限:可对所有普通用户开启/关闭功能权限,包括复刻形象及声音、声音复刻(限免功能)

image

3、资源权限:

管理员账户可针对不同业务,对某个子账号进行对应的资源量控制,也可查看每个子账号当前的可用最大资源量和已使用资源量。

image

  • 设置资源量:当前页面可查看主账号可用公共资源数剩余量,根据该剩余量可限制某个子账号最大可使用的资源量,分配的可用最大资源用量数值,不得超过主账号的资源用量。

  • 修改资源量:可对已编辑过的配置进行修改,其中追加和减少表示在当前配置的总量上进行增减,当前子账号已有限制最大资源量时,再次修改,需要大于等于已使用/已占用资源量

image

  • 取消限制:即取消某个子账号最大可用资源量的限制,该子账号可以使用主账号公共资源池中的所有资源。

image

4、配置记录:

管理员在配置记录中可查看对某个子账号的配置记录,以及对应操作人。

image

三、项目制作

1、新建互动数字人项目

  • 输入视频名称

  • 选择视频比例 9:16、16:9

  • 选择扣减的实时交互资源

image

2、主播形象

选择最终项目生成的主播形象,支持公模或私模的选择。

image

3、背景

选择背景,支持平台预置的推荐背景,或上传自定义背景,文件格式支持png/jpg,大小不超过10MB

image

4、声音

为主播形象配置声音,支持公共声音或定制声音的选择,声音右上角小耳机图标支持声音试听。

也支持为声音设置倍速播报,支持0.8倍、0.9倍、1倍、1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、2倍速。

image5、智能体

可以为主播设置一个智能体,选择某个智能体后,可以为AI问答设置人设和答复规则。

image

新建智能体

image

  • 智能体名称自定义:不超过20字

  • 智能体头像:支持jpg\jpeg\png格式,尺寸建议1:1,可以通过“通义万象”生成免费头像

  • 详细描述:对智能体的人设进行简单描述,不超过2000字。

例如:

你是一个男性视频直播销售人员,你的直播风格生动活泼,又有说服力。你擅长在销售中穿插笑点,总能通过诙谐幽默的语言风格吸引观众注意,同时自然展现商品魅力,让观众在轻松愉悦的氛围下购物下单。

回答规则:

1.语言风格需诙谐幽默,能迅速抓住听众兴趣。

2.每句话回复控制在20字左右,且不应超过100字。

3.确保信息简洁明了,保持交流的高效与节奏感。

回答示例:

1.哈哈,这位朋友眼光真独到,看上的都是咱们店的热销款!

2.别犹豫啦,错过这村可没这店了,优惠不等人哦~

其他:

除了直播销售,你还擅长在直播结束后整理观众反馈,不断优化直播内容和商品选择,致力于提供更优质的用户观看和购物体验。

  • 所属行业

  • 大模型回复:智能体生成回复时会参考知识库文档。若用户的输入没有可参考的知识库文档:本开关打开时,将使用大模型直接生成回复;本开关关闭时,将使用兜底话术回复

  • 大模型版本:选项从上到下,模型规模递增,效果递增,时延递增,其中72b-instruct进行了指令理解上的微调增强,可以更好理解复杂的prompt指令image

  • 可设置最大回复长度字数:模糊控制,并非精准控制

  • 回复多样性:0.1-1,值越大回复越多样性

  • 联网搜索:打开智能体将能访问实时网络信息,同时整体时延提升

  • 支持引用知识库image

  • 知识库检索策略:快速检索、标准检索、高级检索,策略越高级时延越长

话术配置image

  • 开场话术配置:该话术在用户进入对话时触发,支持配置多条,智能体将随机使用一条,可使用AI智能话术为您自动生成,不满意时可以“换一换”

  • 拒绝话术配置:该话术在用户输入包含拒绝关键词时触发,支持配置多条话术,智能体将随机使用其中一条,可使用AI智能话术为您自动生成,不满意时可以“换一换”

  • 兜底话术配置:该话术在其他话术与知识库文档均未命中,且大模型回复开关关闭时触发,支持配置多条话术,智能体将随机使用其中一条,可使用AI智能话术为您自动生成,不满意时可以“换一换”

配置完成智能体信息后,保存并发布,即可在智能体库中选择到该智能体。

image

三、项目预览并发布

预览:编辑器右上方将项目信息保存后,即可对项目进行预览,预览将占用1路空闲资源,请预览前确保有剩余空闲资源,预览资源准备时需耐心等待。

image

预览页面右下角可以输入与数字人互动的问题,数字人将为您答复,可人工打断回答,不需要时可结束对话。

image

发布:退出页面后,在项目管理中可查看每个项目的状态,“停止预览”即可释放预览被占用的路数资源,发布即可将项目正式发布,会扣减账户中的一路资源,发布后,您可以通过正式接口调用实时交互服务,进行实时互动或实时渲染,并正式应用在您的业务场景中,您可以按照实际业务场景中的并发量来分配发布所需要使用的资源量。

image

四、账户资源管理

右上角账号-资源管理中,可查看账号的剩余权益、消耗历史、购买历史。

image

image

image