基于神经网络的语音应答方法、存储介质以终端设备技术

技术编号:24802290 阅读:29 留言:0更新日期:2020-07-07 21:31
本发明专利技术公开了一种基于神经网络的语音应答方法、存储介质以终端设备,所述方法包括:当接收到用户输入的用户语音时,根据所述用户语音确定其对应的应答语音;将所述应答语音输入预设的表情特征生成模型以获取所述应答语音对应的表情特征序列;根据所述表情特征序列确定所述应答语音对应的面部表情序列,并控制预设的虚拟形象播放所述应答语音且同步播放面部表情序列。本发明专利技术通过预设表情特征生成模型确定应答语音对应的表情特征序列,并根据所述表情特征序列对应的面部表情控制虚拟形象播放应答语音时的面部表情,使得应答语音以面部表情相对应,提高了面部表情的准确性和真实性,从而使得人机交互的真实感对话更加逼真和细腻。

【技术实现步骤摘要】
基于神经网络的语音应答方法、存储介质以终端设备
本专利技术涉及语音交互
,特别涉及一种基于神经网络的语音应答方法、存储介质以终端设备。
技术介绍
随着人工智能时代的来临,基于AI的人机交互方式也越来越流行起来,其中,可视化语音应答成为人们关注的热点。可视化语音应答是通过虚拟形象播放应答语音的一种人机交互方式。目前,可视化语音应答虽然可以将普通用户与计算机,通过自然语言识别,理解,合成紧密的结合在一起。但是,当虚拟形象模拟真实人进行语音交互时,虚拟形象模拟的真人面部表情与真人面部表情偏差大,使得人机交互的真实感降低。
技术实现思路
鉴于现有技术的不足,本专利技术旨在提供一种基于神经网络的语音应答方法、存储介质以终端设备,以提高虚拟形象的面部表情的准确性。本专利技术所采用的技术方案如下:一种基于神经网络的语音应答方法,其包括:当接收到用户输入的用户语音时,根据所述用户语音确定其对应的应答语音;将所述应答语音输入预设的表情特征生成模型以获取所述应答语音对应的表情特征序列;<br>根据所述表情特本文档来自技高网...

【技术保护点】
1.一种基于神经网络的语音应答方法,其特征在于,其包括:/n当接收到用户输入的用户语音时,根据所述用户语音确定其对应的应答语音;/n将所述应答语音输入预设的表情特征生成模型以获取所述应答语音对应的表情特征序列;/n根据所述表情特征序列确定所述应答语音对应的面部表情序列,并控制预设的虚拟形象播放所述应答语音且同步播放面部表情序列。/n

【技术特征摘要】
1.一种基于神经网络的语音应答方法,其特征在于,其包括:
当接收到用户输入的用户语音时,根据所述用户语音确定其对应的应答语音;
将所述应答语音输入预设的表情特征生成模型以获取所述应答语音对应的表情特征序列;
根据所述表情特征序列确定所述应答语音对应的面部表情序列,并控制预设的虚拟形象播放所述应答语音且同步播放面部表情序列。


2.根据权利要求1所述基于神经网络的语音应答方法,其特征在于,所述将所述应答语音输入预设的表情特征生成模型以获取所述应答语音对应的表情特征序列具体包括:
将所述应答语音转换到频域以得到其对应的第一频谱图,并将所述第一频谱图切分成时间序列;
将所述时间序列输入预设表情特征生成模型以获取相应的表情特征序列,其中,所述表情特征序列与应答语音按时间同步对应。


3.根据权利要求1所述基于神经网络的语音应答方法,其特征在于,所述根据所述表情特征序列确定所述应答语音对应的面部表情序列,并控制预设的虚拟形象播放所述应答语音且同步播放面部表情序列具体包括:
将所述表情特征序列中的各第一表情特征依次重定向至预设的虚拟形象模型上,以得到所述应答语音对应的面部表情序列;
控制预设的虚拟形象播放所述应答语音且同步播放面部表情序列,其中,所述面部表情序列与应答语音按时间轴同步。


4.根据权利要求3所述基于神经网络的语音应答方法,其特征在于,所述将所述表情特征序列中的各第一表情特征依次重定向至预设的虚拟形象模型上,以得到所述应答语音对应的面部表情序列具体包括:
按照时间序列提取所述表情特征序列包含的各第一表情特征,其中,所述第一表情特征包括若干表情特征点;
对于每个第一表情特征将其包含的所有表情特征点均重定向至预设的虚拟形象的模型上,以得到所述应答语音对应的面部表情序列。


5.根据权利要求4所述基于神经网络的语音应答方法,其特...

【专利技术属性】
技术研发人员:赵智宝
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1