The technical scheme of the invention comprises an elderly speech emotion recognition method based on WFST, the method comprises the following steps: using WFST to create emotional acoustic model, emotion dictionary, grammar model and emotional emotional type converter, further acoustic model, emotion dictionary, emotion and emotion grammar model type converter building at least one WFST map based on; using the receiver each state diagram of WFST graph is obtained by calculating the acoustic likelihood is low, further receiver data on a WFST map based on emotion recognition; combined with the emotion recognition results obtained using a variety of Cepstrum and pitch were compared with the emotional base based on emotion recognition, get different emotion rate further, combined with the selection Cepstrum and pitch optimal emotion recognition rate of recognition of the corresponding emotion. The invention has the advantages of higher recognition rate relative to the existing emotion recognition, and optimal recognition of different emotion recognition schemes according to different emotions.
【技术实现步骤摘要】
一种基于WFST的老年人语音情感识别方法
本专利技术涉及一种基于WFST的老年人语音情感识别方法,属于计算机语音识别领域。
技术介绍
在智能辅助系统研究中,使用者的情感识别是一个比较重要的问题,越来越受到人们的重视,这可能是因为情感是人们通信交流中比较重要的一个方面。对于老年人而言,情感可以帮助他们和外界进行有效的交流,另外,情感是人们所处的环境和心理状态的反映。现有的研究者建立语音情感库常采用模拟语音、诱导语音和自然语音三种方式。模拟语音让专业或非专业人士进行情感模仿进行情感模仿录制,诱导语音是营造适当的环境氛围刺激专业人士或非专业人士进行录音,自然语音是从现实生活中采集真实的自然情感资料。模拟语音的情感成分有时会被夸大,情感自然度和现实真实的情感有较大差距,诱导语音的缺点是无法确定环境对录音者的刺激是否有效,自然语音是人们现实生活中最真实的情感语音,但是它获取方式比较困难,而且还牵涉到很多社会道德问题,目前常采用从影视剧中截取一些自然的情感对话片段的方法对题,但是这种方法的缺点是工作量比较大,而且有时候可能会有音乐背景。WFST:加权有限状态转换机。一个WFST图有一系列的状态,每个状态都要参于运算,在状态之间有连接弧,每个连接弧有一个输入标注、一个输出标注和一个权重。
技术实现思路
针对现有技术的不足,本专利技术的技术方案提供了一种基于WFST的老年人语音情感识别方法,用于实现对老年人的情感。本专利技术的技术方案包括一种基于WFST的老年人语音情感识别方法,其特征在于通过构建WFST网络,对老年人情感进行识别,包括:A.使用WFST分别创建情感声学模型、 ...
【技术保护点】
一种基于WFST的老年人语音情感识别方法,其特征在于通过构建WFST网络,对老年人情感进行识别,包括:A.使用WFST分别创建情感声学模型、情感字典、情感语法模型及情感类型转换器,进一步基于声学模型、情感字典、情感语法模型及情感类型转换器构建至少一个WFST图;B.使用接收器对WFST图的每个状态图进行计算得到声学特征的似然度,进一步基于接收器接收数据对WFST图进行情感识别;C.基于所述步骤B得到的情感识别结果使用多种倒谱特征和基频的结合与情感库进行对比,得到不同情感的情感识别率,进一步,选取最优情感识别率的倒谱特征和基频的结合对对应的情感进行识别。
【技术特征摘要】
1.一种基于WFST的老年人语音情感识别方法,其特征在于通过构建WFST网络,对老年人情感进行识别,包括:A.使用WFST分别创建情感声学模型、情感字典、情感语法模型及情感类型转换器,进一步基于声学模型、情感字典、情感语法模型及情感类型转换器构建至少一个WFST图;B.使用接收器对WFST图的每个状态图进行计算得到声学特征的似然度,进一步基于接收器接收数据对WFST图进行情感识别;C.基于所述步骤B得到的情感识别结果使用多种倒谱特征和基频的结合与情感库进行对比,得到不同情感的情感识别率,进一步,选取最优情感识别率的倒谱特征和基频的结合对对应的情感进行识别。2.根据权利要求1所述的基于WFST的老年人语音情感识别方法,所述步骤A还包括:S21,使用公式得到从情感类型受到G约束的情感类型映射的转换器,其中L表示情感字典,G表示情感语法模型,用于表示WFST中的运算;S22,使用公式得到依赖于内容的情感类型到G受约束的情感类型的转换器,其中C表示从依赖于内容的情感类型到不依赖于情感类型的转换器;S23,使用计算得到分布到受G约束的情感映射,进一步,通过情感映射构建对应的WFST图。3.根据权利要求1所述的基于WFST的老年人语音情感识别方法,所述步骤B还包括:S...
【专利技术属性】
技术研发人员:李威,杨继臣,杨忠明,常亚萍,
申请(专利权)人:广东科学技术职业学院,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。