数字人交互控制方法、装置、电子设备和存储介质制造方法及图纸

技术编号:38355774 阅读:11 留言:0更新日期:2023-08-05 17:27
本发明专利技术公开了一种数字人交互控制方法、装置、电子设备和存储介质,该方法包括:获取用户音频,基于预设语音识别模型对所述用户音频进行语音识别,得到交互请求信息;根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数;根据所述交互请求信息获取答复音频,并根据所述答复音频确定所述目标数字人的动作参数;基于所述形象参数和所述动作参数生成与所述目标数字人对应的交互动画,以此基于与用户音频对应的形象参数和动作参数驱动数字人进行互动,实现了更加高效的进行数字人交互,提升了用户体验。提升了用户体验。提升了用户体验。

【技术实现步骤摘要】
数字人交互控制方法、装置、电子设备和存储介质


[0001]本申请涉及计算机
,更具体地,涉及一种数字人交互控制方法、装置、电子设备和存储介质。

技术介绍

[0002]随着人工智能的不断发展,数字人交互也开始应用在各个领域中,以实现智能化的人机交互。现有技术中,在与数字人进行交互时,数字人的语言交互与肢体动作中经常存在衔接延迟、动作与表述不一致、动作单一等问题,造成交互效率较低,影响了用户体验。
[0003]因此,如何更加高效的进行数字人交互,提升用户体验,是目前有待解决的技术问题。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本申请实施例提出了一种数字人交互控制方法、装置、电子设备和存储介质,用以更加高效的进行数字人交互,提升用户体验。
[0006]第一方面,提供一种数字人交互控制方法,所述方法包括:获取用户音频,基于预设语音识别模型对所述用户音频进行语音识别,得到交互请求信息;根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数;根据所述交互请求信息获取答复音频,并根据所述答复音频确定所述目标数字人的动作参数;基于所述形象参数和所述动作参数生成与所述目标数字人对应的交互动画。
[0007]第二方面,提供一种数字人交互控制装置,所述装置包括:获取模块,用于获取用户音频,基于预设语音识别模型对所述用户音频进行语音识别,得到交互请求信息;第一确定模块,用于根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数;第二确定模块,用于根据所述交互请求信息获取答复音频,并根据所述答复音频确定所述目标数字人的动作参数;生成模块,用于基于所述形象参数和所述动作参数生成与所述目标数字人对应的交互动画。
[0008]第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行第一方面所述的数字人交互控制方法。
[0009]第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的数字人交互控制方法。
[0010]通过应用以上技术方案,获取用户音频,基于预设语音识别模型对所述用户音频进行语音识别,得到交互请求信息;根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数;根据所述交互请求信息获取答复音频,并根据所述答复音频确定所述目标数字人的动作参数;基于所述形象参数和所述动作参数生成与所述目标数字人
对应的交互动画,以此基于与用户音频对应的形象参数和动作参数驱动数字人进行互动,实现了更加高效的进行数字人交互,提升了用户体验。
附图说明
[0011]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0012]图1示出了本专利技术实施例提出的一种数字人交互控制方法的流程示意图;
[0013]图2示出了本专利技术另一实施例提出的一种数字人交互控制方法的流程示意图;
[0014]图3示出了本专利技术又一实施例提出的一种数字人交互控制方法的流程示意图;
[0015]图4示出了本专利技术实施例提出的一种数字人交互控制装置的结构示意图;
[0016]图5示出了本专利技术实施例提出的一种电子设备的结构示意图。
具体实施方式
[0017]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0018]需要说明的是,本领域技术人员在考虑说明书及实践这里公开的专利技术后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本
中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由权利要求部分指出。
[0019]应当理解的是,本申请并不局限于下面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
[0020]本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
[0021]本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0022]本申请实施例提供一种数字人交互控制方法,如图1所示,该方法包括以下步骤:
[0023]步骤S101,获取用户音频,基于预设语音识别模型对所述用户音频进行语音识别,得到交互请求信息。
[0024]用户音频可以是基于音频采集设备实时采集的,也可以是从本地上传或从其他服务器获取的,获取用户音频后,将用户音频输入预设语音识别模型进行语音识别,根据语音
识别结果得到交互请求信息。
[0025]可选的,与预设语音识别模型对应的语音识别算法可以为包括基于动态时间规整(DTW)算法、基于非参数模型的矢量量化(VQ)方法、基于参数模型的隐马尔可夫模型(HMM)的方法、基于人工神经网络(ANN)和支持向量机等算法的任一种。
[0026]步骤S102,根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数。
[0027]目标数字人为与用户进行交互的数字人,音频属性可以是音调和/或音色,还可以是强度特征和发音特征,根据用户音频的音频属性和交互请求信息确定目标数字人的形象参数。可选的,形象参数为包括外形特征、动作特征、声音特征中的任一种。外形特征可包括数字人的发型、服装、背景图等,动作特征可包括数字人的肢体动作,如招手、挥手、鞠躬、点头、弯腰等,声音特征可包括男声/女声,甜美/轻柔,活泼/可爱/严肃等。
[0028]其中,若音频属性为强度特征和发音特征,音频属性的获取过程包括:对所述用户音频进行频谱分析处理,得到频谱强度,并将所述频谱强度作为所述强度特征;识别所述用户音频的音调周期频率,并根据所述音调周期频率和预设周期阈值的比较结果确定所述发音特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数字人交互控制方法,其特征在于,所述方法包括:获取用户音频,基于预设语音识别模型对所述用户音频进行语音识别,得到交互请求信息;根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数;根据所述交互请求信息获取答复音频,并根据所述答复音频确定所述目标数字人的动作参数;基于所述形象参数和所述动作参数生成与所述目标数字人对应的交互动画。2.如权利要求1所述的方法,其特征在于,所述根据所述用户音频的音频属性和所述交互请求信息确定目标数字人的形象参数,包括:根据所述音频属性确定所述用户的用户特征信息;根据所述交互请求信息确定场景信息;根据所述用户特征信息和所述场景信息确定所述形象参数。3.如权利要求2所述的方法,其特征在于,所述根据所述用户特征信息和所述场景信息确定所述形象参数,包括:将所述用户特征信息与多个预设动作特征标签和多个预设声音特征标签比对,确定与所述用户特征信息匹配的目标动作特征标签和目标声音特征标签;将所述场景信息与多个预设外形特征标签进行比对,确定与所述场景信息匹配的目标外形特征标签;根据与所述目标动作特征标签对应的动作特征参数、与所述目标声音特征标签对应的声音特征参数和与所述目标外形特征标签对应的外形特征参数确定所述形象参数。4.如权利要求1所述的方法,其特征在于,所述根据所述答复音频确定所述目标数字人的动作参数,包括:按预设解析规则对所述答复音频进行解析,得到所述答复音频的语义信息和/或语调信息;根据预设匹配关系从多个第一动作中确定与所述语义信息和/或语调信息匹配的至少一个第一目标动作;根据所述第一目标动作确定所述动作参数。5.如权利要求4所述的方法,其特征在于,在根据所述第一目标动作确定所述动作参数之后,所述方法还包括:根据所述答复音频的长度信息从多个第二动作中确定至少一个第二目标动作;按预设插入规则将与所述第二目标动作对应的参数增加至所述动作参数中。6.如权利要求4所述的方法,其特征在于,在根据所述...

【专利技术属性】
技术研发人员:沈中熙钱晓亮
申请(专利权)人:厦门黑镜科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1