【技术实现步骤摘要】
个性化虚拟人的生成方法及系统
[0001]本专利技术涉及一种个性化虚拟人的生成方法,同时也涉及相应的个性化虚拟人生成系统,属于人机交互
技术介绍
[0002]广义的虚拟人指由计算机动画(Computer Graphics,简称为CG)技术构建、以代码形式运行的拟人化形象。概括地说,虚拟人、数字人、虚拟数字人均指通过CG技术创造出的拟人化形象,它们被赋予鲜明的人物设定,以代码与数据的形式在计算设备上运行。其中,虚拟人强调其在外观上与真人的相似性;数字人强调其存在于二进制的数字世界中,既可以是根据真人生成的1:1数字孪生,亦可以是完全虚构的形象与身份;虚拟数字人则有着更为严格的定义,根据人工智能产业发展联盟发布的《2020年虚拟数字人发展白皮书》,虚拟数字人具备三大特征:1)拥有人的外观及性格特征;2)拥有通过语言、表情或肢体动作表达的能力;3)拥有识别外界环境、与人交流互动的能力。
[0003]虚拟人在医疗健康领域可以兼备虚拟专家和虚拟陪伴两种功能。一方面,可利用深度学习技术,自动识别临床数据指标,模拟医生思 ...
【技术保护点】
【技术特征摘要】
1.一种个性化虚拟人的生成方法,其特征在于包括如下步骤:基于目标群体的文本信息,预先建立通用虚拟人模型Fm,其中,m为所述通用虚拟人模型的数量,m∈[1,m];基于目标群体的声音信息,预先建立通用声音模型Vn,其中,n为所述通用声音模型的数量,n∈[1,n];在所述通用虚拟人模型中,获取用户偏好的通用虚拟人模型;在所述通用声音模型中,获取用户偏好的通用声音模型;获取用户的偏好面孔信息和偏好音乐信息;基于用户偏好的通用虚拟人模型与用户的偏好面孔信息,生成个性化面孔模型;基于用户偏好的通用声音模型与用户的偏好音乐信息,生成个性化声音模型;根据所述个性化面孔模型与所述个性化声音模型,融合生成个性化虚拟人。2.如权利要求1所述的生成方法,其特征在于:所述偏好面孔信息包括偏好面孔的图片或视频,以及偏好表情的图片或视频;所述偏好音乐信息包括偏好音乐片段或偏好语音片段。3.如权利要求2所述的生成方法,其特征在于基于所述用户偏好的通用虚拟人模型与所述用户的偏好面孔信息,生成个性化面孔模型,具体包括如下步骤:获取所述用户提供的偏好面孔的图片或视频;将所述偏好面孔的图片或视频输入平均脸算法,与符合用户偏好的通用虚拟人按照预设比例进行特征融合,以生成个性化面孔模型。4.如权利要求3所述的生成方法,其特征在于还包括:获取所述用户提供的偏好表情的图片或视频;将所述偏好表情的图片或视频与所述个性化虚拟人面孔进行特征融合,以生成多表情的个性化面孔模型。5.如权利要求3所述的生成方法,其特征在于所述特征融合具体包括如下步骤:在所述偏好面孔的图片或视频中提取预设数量的特征点;将原始图片坐标系中特征点的位置通过相似变换转换到输出坐标系;计算输出图像坐标中所有转换后的地标的平均值;三角剖分目的网格化图像脸部区域,得到由预设数量个点数组中的点索引组成的三角形列表;对输入图像中三角形的三个顶点和三角剖分后的平均特征点的相应点进行仿射变换;将所有变形后图像的像素强度相加并除以图像数量,以进行面部平均化。6.如权利要求2所述的生成方法,其特征在于基于所述用户偏好的通用声音模型与所述用户的偏好音乐信息,生成个性化声音模型,具体包括如下步骤:获取所述用户提供的偏好音乐片段或偏好语音片段;通过Adaspeech模型将所述偏好音乐片段或偏好语音片段与所述用户偏好的通用声音模型进行语音合成,以生成个性化声音模型。7.如权利要求1所述的生成方法,其特征在于根据所述个性化面孔模型与所述个性化声音模型,融合生成个性化虚拟...
【专利技术属性】
技术研发人员:胡颖,傅小兰,马珠江,沈一,王晓怡,
申请(专利权)人:北京智精灵科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。