一种超写实数字人工作助手实现方法和系统技术方案

技术编号:40321314 阅读:21 留言:0更新日期:2024-02-09 14:17
本发明专利技术公开了一种超写实数字人工作助手实现方法和系统,通过根据所述目标客服图像向量x<subgt;i</subgt;生成多张多视角的目标客服图像集合Σg(x<subgt;d</subgt;);将所述多张多视角的目标客服图像集合Σg(x<subgt;d</subgt;)经过扩散学习得到含有噪声特征的所述目标客服图像数据集X<subgt;t‑1</subgt;;计算输出生成的三维超写实数字人图像样本数据δ,生成目标客服的三维超写实数字人视频动画ψ,采用所述目标语音向量a和所述目标文本向量t及所述目标客服的三维超写实数字人视频动画ψ作为集合D,将输出的指令集合和所述超写实数字人动画作为输入进行视频合成,生成满足业务对答动画视频D′。可以实现随着不同的业务场景生成多场景元宇宙数字人客服人员工作助手,同时该系统随着数据和算法更新升级实现智能优化过程。

【技术实现步骤摘要】

本申请涉及超写实数字人工作助手实现,特别是涉及一种超写实数字人工作助手实现方法和系统


技术介绍

1、目前主流的客服场景数字人是基于2d图像渲染技术为主生成的仿真图形图像学基础上采用视频融合技术实现了整体的动画,另外是通过非视频方式结合固定的业务流程配置和意识识别实现,以上方法主要存在以下两个问题:

2、无法实现通过实时的问答驱动视频、语音、文本同用户交互和生成数字人;

3、无法通过统一流程处理多模态的视频图像、语音、文本数据进行多任务计算处理数字人所表达的业务。


技术实现思路

1、基于此,针对上述技术问题,提供一种超写实数字人工作助手实现方法和系统以解决现有主流的客服场景数字人无法实现通过实时的问答驱动视频、语音、文本同用户交互和生成数字人的问题。

2、第一方面,一种超写实数字人工作助手实现方法,所述方法包括:

3、获取目标客服照片或视频、所述目标客服业务知识库文本以及所述目标客服沟通过程的应答业务音频;

4、采用预设工具将所述目标客服照片或视频转本文档来自技高网...

【技术保护点】

1.一种超写实数字人工作助手实现方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述目标客服图像向量xi生成多张多视角的目标客服图像集合∑g(xd)包括:

3.根据权利要求1所述的方法,其特征在于,所述将所述多张多视角的目标客服图像集合∑g(xd)经过扩散学习得到含有噪声特征的所述目标客服图像数据集Xt-1,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据神经辐射场算法,输入所述目标客服图像数据集Xt-1,按照不同视角提取特征后神经网络通过场辐射计算输出生成的三维超写实数字人图像样本数据δ,包括:

<...

【技术特征摘要】

1.一种超写实数字人工作助手实现方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述目标客服图像向量xi生成多张多视角的目标客服图像集合∑g(xd)包括:

3.根据权利要求1所述的方法,其特征在于,所述将所述多张多视角的目标客服图像集合∑g(xd)经过扩散学习得到含有噪声特征的所述目标客服图像数据集xt-1,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据神经辐射场算法,输入所述目标客服图像数据集xt-1,按照不同视角提取特征后神经网络通过场辐射计算输出生成的三维超写实数字人图像样本数据δ,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据目标学习法计算所述三维超写实数字人图像连续时间上的差异量特征,将所述差异量特征按照时间和概率的时序分布插帧合成目标客服通过图像和...

【专利技术属性】
技术研发人员:张晶姜晓丹王双王广志
申请(专利权)人:伽睿信创科技服务北京有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1