基于语音信息的VR游戏人物表情控制方法及存储介质技术

技术编号:24012889 阅读:37 留言:0更新日期:2020-05-02 02:21
本发明专利技术涉及基于语音信息的VR游戏人物表情控制方法,包括:步骤101、获取用户的测试请求信息,在取得用户的测试请求信息后,显示词条库列表供用户挑选其中的一条词条信息并提示用户进行朗读;步骤102、获取用户的朗读时长T、用户朗读的音量B,并对用户朗读的词条进行语音识别;步骤103、根据语音识别的结果结合朗读时长评判规则以及朗读音量评判规则得出用户的情感意向;步骤104、根据得出的情感意向结果控制VR游戏人物做出相应的表情。本发明专利技术能够通过用户的朗读来对用户朗读的词条进行识别,并根据识别的结果以及用户朗读的音量以及语速预测用户的情感意向,并根据预测的结果对VR游戏人物的表情进行控制,计算相对简单且具有一定的趣味性。

VR game character expression control method and storage medium based on voice information

【技术实现步骤摘要】
基于语音信息的VR游戏人物表情控制方法及存储介质
本专利技术涉及VR领域,尤其涉及基于语音信息的VR游戏人物表情控制方法及存储介质。
技术介绍
在VR游戏中,虚拟环境提供了一种很好的沉浸式情感诱发材料,在现有的情感诱发系统中,主要的诱发材料有情感图片、语音、视频及音乐。在情感评估领域,情感诱发的方式为被动式诱发,即通过观看情感诱发材料来诱发对应的情感。当今市场在对VR游戏人物的控制时,虽然也存在通过预测用户的自身情感来对游戏人物的表情进行同步控制,但是这种计算往往十分复杂,需要通过对用户的多个生理信息进行整合计算,计算量十分大,当今市场需要一种较为简单的通过预测用户的自身情感对VR游戏人物进行控制的方法。
技术实现思路
本专利技术的目的是解决现有技术的不足,提供基于语音信息的VR游戏人物表情控制方法及存储介质,能够通过用户的朗读来对用户朗读的词条进行识别,并根据识别的结果以及用户朗读的音量以及语速对用户的情感意向进行预测,并根据预测的结果对VR游戏人物的表情进行控制,计算相对简单且具有一定的趣味性。为了实现上述目的,本专利技术采用以下的技术方案:提出一种基于生理信息的情感评估系统,包括以下:步骤101、获取用户的测试请求信息,在取得用户的测试请求信息后,显示词条库列表供用户挑选其中的一条词条信息并提示用户进行朗读;步骤102、获取用户的朗读时长T、用户朗读的音量B,并对用户朗读的词条进行语音识别;步骤103、根据语音识别的结果结合朗读时长评判规则以及朗读音量评判规则得出用户的情感意向;步骤104、根据得出的情感意向结果控制VR游戏人物做出相应的表情。进一步,上述步骤102中的对用户朗读的词条进行语音识别的操作具体包括以下:步骤201、对用户朗读的语音信息进行预处理操作得到第一语音信息;步骤202、对所述第一语音信息进行特征提取后进行语音识别。进一步,上述步骤201中的对用户朗读的词条进行预处理操作具体包括以下:步骤301、对用户的语音信息进行预加重处理得到中间语音信息,所述预加重具体为如下关系式,Bn=An-a*An-1,其中Bn代表中间语音信息,An代表用户的语音信息,a为常数,a的取值范围为[0.90,1.00];步骤302、对中间语音信息进行加窗处理得到第一语音信息,所述加窗具体为如下关系式,Cn=Bn*W(n),其中Cn代表第一语音信号,W(n)为窗函数,W(n)具体为步骤303、通过短时能量的形式对第一语音信息进行端点检测区分清音段与浊音段。进一步,上述步骤202中的对第一语音信息进行特征提取的具体方式包括以下:步骤401、将第一语音信息经过傅立叶变换得到每个语音帧的时域信号c(n);步骤402、将时域信号c(n)进行末位补0的形式形成程度为N的序列,通过离散傅立叶变换得到该序列的线性频谱X(k),具体转换形式为:步骤403、将线性频谱X(k)通过MEL频率滤波器组得到MEL频谱,对MEL频谱通过对数能量的处理得到对数频谱Q(m),其中MEL频率滤波器组包括不少于2个带通滤波器,每个带通滤波器的传递函数为:其中0≤m≤M,M为滤波器的个数,而当中的fh以及fl分别表示滤波器的频率的最高应用以及最低应用的情况,Fs为采样频率,N为进行离散傅立叶变换的窗函数的窗宽,而x表示自变量;相应的,步骤404、将对数频谱Q(m)经过离散余弦变换得到MFCC系数d(n)为:进一步,上述步骤103中的情感意向的得出具体包括以下:步骤501、根据语音识别的结果结合语句预置分数得到第一分数;步骤502、根据用户的朗读时长T,划分时长得分段,判断用户的朗读时长T落在对应得分段的区间得到第二分数;步骤503、根据用户的朗读音量B,划分音量得分段,判断用户的朗读音量落在对应得分段的区间得到第三分数;步骤504、计算第一分数、第二分数以及第三分数的总和,划分总和得分段,每一个得分段对应一种情感状态,判断用户的得分总和所属的得分段得到用户的情感状态。进一步,上述步骤501中的语句预置分数通过以下方法得到:在收录相关语句时,根据语句的语意评估得到语句的预置分数,并与所述语句共同形成数据库表格,当语音识别得到语句时,通过查表的方式得到该语句的预置分数。还提出了一种计算机可读存储的介质,所述计算机可读存储的介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述方法的步骤。本专利技术的有益效果为:本专利技术能够以用户读词条的趣味游戏方式来获取用户的情感状态,通过对用户所读词条进行语音识别,结合用户的语速以及音量来对用户的情感状态进行判断。附图说明图1所示为本专利技术基于语音信息的VR游戏人物表情控制方法流程图。具体实施方式以下将结合实施例和附图对本专利技术的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本专利技术的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。附图中各处使用的相同的附图标记指示相同或相似的部分。参照图1,包括以下:步骤101、获取用户的测试请求信息,在取得用户的测试请求信息后,显示词条库列表供用户挑选其中的一条词条信息并提示用户进行朗读;步骤102、获取用户的朗读时长T、用户朗读的音量B,并对用户朗读的词条进行语音识别;步骤103、根据语音识别的结果结合朗读时长评判规则以及朗读音量评判规则得出用户的情感意向;步骤104、根据得出的情感意向结果控制VR游戏人物做出相应的表情。作为本专利技术的优选实施方式,上述步骤102中的对用户朗读的词条进行语音识别的操作具体包括以下:步骤201、对用户朗读的语音信息进行预处理操作得到第一语音信息;步骤202、对所述第一语音信息进行特征提取后进行语音识别。作为本专利技术的优选实施方式,上述步骤201中的对用户朗读的词条进行预处理操作具体包括以下:步骤301、对用户的语音信息进行预加重处理得到中间语音信息,所述预加重具体为如下关系式,Bn=An-a*An-1,其中Bn代表中间语音信息,An代表用户的语音信息,a为常数,a的取值范围为[0.90,1.00];步骤302、对中间语音信息进行加窗处理得到第一语音信息,所述加窗具体为如下关系式,Cn=Bn*W(n),其中Cn代表第一语音信号,W(n)为窗函数,W(n)具体为步骤303、通过短时能量的形式对第一语音信息进行端点检测区分清音段与浊音段。作为本专利技术的优选实施方式,上述步骤202中的对第一语音信息进行特征提取的具体方式包括以下:步骤401、将第一语音信息经过傅立叶变换得到每个语音帧的时域本文档来自技高网...

【技术保护点】
1.基于语音信息的VR游戏人物表情控制方法,其特征在于,包括以下:/n步骤101、获取用户的测试请求信息,在取得用户的测试请求信息后,显示词条库列表供用户挑选其中的一条词条信息并提示用户进行朗读;/n步骤102、获取用户的朗读时长T、用户朗读的音量B,并对用户朗读的词条进行语音识别;/n步骤103、根据语音识别的结果结合朗读时长评判规则以及朗读音量评判规则得出用户的情感意向;/n步骤104、根据得出的情感意向结果控制VR游戏人物做出相应的表情。/n

【技术特征摘要】
1.基于语音信息的VR游戏人物表情控制方法,其特征在于,包括以下:
步骤101、获取用户的测试请求信息,在取得用户的测试请求信息后,显示词条库列表供用户挑选其中的一条词条信息并提示用户进行朗读;
步骤102、获取用户的朗读时长T、用户朗读的音量B,并对用户朗读的词条进行语音识别;
步骤103、根据语音识别的结果结合朗读时长评判规则以及朗读音量评判规则得出用户的情感意向;
步骤104、根据得出的情感意向结果控制VR游戏人物做出相应的表情。


2.根据权利要求1所述的基于语音信息的VR游戏人物表情控制方法,其特征在于,上述步骤102中的对用户朗读的词条进行语音识别的操作具体包括以下:
步骤201、对用户朗读的语音信息进行预处理操作得到第一语音信息;
步骤202、对所述第一语音信息进行特征提取后进行语音识别。


3.根据权利要求2所述的基于语音信息的VR游戏人物表情控制方法,其特征在于,上述步骤201中的对用户朗读的词条进行预处理操作具体包括以下:
步骤301、对用户的语音信息进行预加重处理得到中间语音信息,所述预加重具体为如下关系式,
Bn=An-a*An-1,
其中Bn代表中间语音信息,An代表用户的语音信息,a为常数,a的取值范围为[0.90,1.00];
步骤302、对中间语音信息进行加窗处理得到第一语音信息,所述加窗具体为如下关系式,
Cn=Bn*W(n),
其中Cn代表第一语音信号,W(n)为窗函数,W(n)具体为



步骤303、通过短时能量的形式对第一语音信息进行端点检测区分清音段与浊音段。


4.根据权利要求3所述的基于语音信息的VR游戏人物表情控制方法,其特征在于,上述步骤202中的对第一语音信息进行特征提取的具体方式包括以下:
步骤401、将第一语音信息经过傅立叶变换得到每个语音帧的时域信号c(n);
步骤402、将时域信号c(n...

【专利技术属性】
技术研发人员:曹明亮谢天华
申请(专利权)人:佛山科学技术学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1