语音情感识别方法、装置、设备及存储介质制造方法及图纸

技术编号:23673448 阅读:24 留言:0更新日期:2020-04-04 18:40
本发明专利技术属于语音信号处理和模式识别技术领域,公开了一种语音情感识别方法、装置、设备及存储介质。该方法包括:获取预设维度的测试语音样本,并通过预设规则对测试语音样本进行分段处理,获得多个初始语音样本;对初始语音样本进行信号特征数据提取,获得待处理语音信号特征数据;通过预设统计函数对待处理语音信号特征数据进行特征统计,获得待确认特征统计结果;根据待确认特征统计结果,通过预设多目标优化算法获得特征目标数据;将特征目标数据输入至预设Softmax分类模型中,获得语音情感识别结果。通过上述方式,将语音情感片段形成语音情感数据,并输入至预设Softmax分类模型中,从而能够更好地识别语音情感。

Speech emotion recognition method, device, equipment and storage medium

【技术实现步骤摘要】
语音情感识别方法、装置、设备及存储介质
本专利技术涉及语音信号处理和模式识别
,尤其涉及一种语音情感识别方法、装置、设备及存储介质。
技术介绍
目前有较多种语音情感识别方法,但是这些方法没有注意到人类的语音情感表达具有短时性和局部性。比如语音情感识别中,前半句、一个词愤怒就可认为整句话愤怒。会出现以下几个问题:一、使用整句话识别情感,经常会稀释情感的特征变化。比如,“我们明天去北京,你觉得可行吗?”,这句话往往后半句才体现较大的情感差别。导致在深度学习中使用针对时间的均值池化、卷积和针对所有特征的全连接层会稀释情感的特征变化;二、局部组合成句子时,经常会中和情感的特征变化。众所周知,汉语语调有一至四声,其中二声和四声在时间变化上的特点完全相反。导致在深度学习中使用针对时间的均值池化,针对时间序列的注意层等均会中和情感的特征变化;三、组成情感的字词在语句中的位置不固定,会造成同情感的特征差异很大。比如,“这样可行吗?”和“可行吗?这样!”表达了相同意思,但是现有卷积神经网络,输出的特征却完全不同。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种语音情感识别方法、装置、设备及存储介质,旨在解决如何准确语音情感的技术问题。为实现上述目的,本专利技术提供了一种语音情感识别方法,所述方法包括以下步骤:获取预设维度的测试语音样本,并通过预设规则对所述测试语音样本进行分段处理,获得多个初始语音样本;对所述初始语音样本进行信号特征数据提取,获得待处理语音信号特征数据;通过预设统计函数对所述待处理语音信号特征数据进行特征统计,获得待确认特征统计结果;根据所述待确认特征统计结果,通过预设多目标优化算法获得特征目标数据;将所述特征目标数据输入至预设Softmax分类模型中,获得语音情感识别结果。优选地,所述获取预设维度的测试语音样本,并通过预设规则对所述测试语音样本进行分段处理,获得多个初始语音样本的步骤之前,还包括:获取预设维度的训练语音样本,并通过预设规则对所述测试语音样本进行分段处理,获得多个初始训练语音样本;对所述初始训练语音样本进行特征提取,获得待处理训练语音信号特征;通过预设统计函数对所述待处理训练语音信号特征进行特征统计,获取待确认训练特征统计结果;根据所述待确认训练特征统计结果,通过预设多目标优化算法获得目标训练特征数据;根据所述目标训练特征数据获取所述目标训练特征数据对应的情感类别;根据所述情感类别和所述情感类别对应的目标训练特征数据建立预设Softmax分类模型。优选地,所述根据所述待确认训练特征统计结果,通过预设多目标优化算法获得目标训练特征数据的步骤,包括:对所述待确认训练特征统计结果进行情感类别划分,获得不同情感类别对应的待优化训练特征数据;根据所述待优化训练特征数据,通过预设多目标优化算法获得目标训练特征数据。优选地,所述将所述特征目标数据输入至预设Softmax分类模型中,获得语音情感识别结果的步骤,包括:将所述特征目标数据输入至所述预设Softmax分类模型中,获得语音情感类别数据;对所述语音情感类别数据进行数据统计,获得语音情感类别数据值;根据所述语音情感类别数据值获得语音情感识别结果。优选地,所述根据所述语音情感类别数据值获得语音情感识别结果的步骤,包括:判断所述语音情感类别数据值是否属于预设语音情感类别阈值范围;若所述语音情感类别数据值属于所述预设语音情感类别阈值范围,则根据所述语音情感类别数据值获得语音情感识别结果。优选地,所述判断所述语音情感类别数据值是否属于预设语音情感类别阈值范围的步骤之后,还包括:若所述语音情感类别数据值不属于所述预设语音情感类别阈值范围,则返回所述将所述特征目标数据输入至所述预设Softmax分类模型中,获得语音情感类别数据的步骤。优选地,所述通过预设统计函数对所述待处理语音信号特征数据进行特征统计,获得待确认特征统计结果的步骤,包括:对所述待处理语音信号特征数据进行筛选,获得标签样本特征数据;通过预设统计函数对所述标签样本特征数据进行特征统计,获得待确认特征统计结果。此外,为实现上述目的,本专利技术还提出一种语音情感识别装置,所述装置包括:获取模块,用于获取预设维度的测试语音样本,并通过预设规则对所述测试语音样本进行分段处理,获得多个初始语音样本;提取模块,用于对所述初始语音样本进行信号特征数据提取,获得待处理语音信号特征数据;统计模块,用于通过预设统计函数对所述待处理语音信号特征数据进行特征统计,获得待确认特征统计结果;计算模块,用于根据所述待确认特征统计结果,通过预设多目标优化算法获得特征目标数据;确定模块,用于将所述特征目标数据输入至预设Softmax分类模型中,获得语音情感识别结果。此外,为实现上述目的,本专利技术还提出一种电子设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音情感识别程序,所述语音情感识别程序配置为实现如上文中任一项所述的语音情感识别方法的步骤。此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有语音情感识别程序,所述语音情感识别程序被处理器执行时实现如上文中任一项所述的语音情感识别方法的步骤。本专利技术通过先获取预设维度的测试语音样本,并通过预设规则对测试语音样本进行分段处理,获得多个初始语音样本,然后对初始语音样本进行信号特征数据提取,获得待处理语音信号特征数据,并对所述待处理语音信号特征数据进行筛选,获得标签样本特征数据,通过预设统计函数对所述标签样本特征数据进行特征统计,获得待确认特征统计结果,之后根据待确认特征统计结果,通过预设多目标优化算法获得特征目标数据,最后将特征目标数据输入至预设Softmax分类模型中,获得语音情感识别结果。通过上述方法,能够充分利用语音情感片段,以及语句与片段之间的情感关系,并转化为语音情感数据,从而提升语音情感识别效果。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的电子设备的结构示意图;图2为本专利技术语音情感识别方法第一实施例的流程示意图;图3为本专利技术语音情感识别方法第二实施例的流程示意图;图4为本专利技术语音情感识别装置第一实施例的结构框图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的电子设备结构示意图。如图1所示,该电子设备可以包括:处理器1001,例如中央处理器(CentralProcessingUnit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器本文档来自技高网...

【技术保护点】
1.一种语音情感识别方法,其特征在于,所述方法包括:/n获取预设维度的测试语音样本,并通过预设规则对所述测试语音样本进行分段处理,获得多个初始语音样本;/n对所述初始语音样本进行信号特征数据提取,获得待处理语音信号特征数据;/n通过预设统计函数对所述待处理语音信号特征数据进行特征统计,获得待确认特征统计结果;/n根据所述待确认特征统计结果,通过预设多目标优化算法获得特征目标数据;/n将所述特征目标数据输入至预设Softmax分类模型中,获得语音情感识别结果。/n

【技术特征摘要】
1.一种语音情感识别方法,其特征在于,所述方法包括:
获取预设维度的测试语音样本,并通过预设规则对所述测试语音样本进行分段处理,获得多个初始语音样本;
对所述初始语音样本进行信号特征数据提取,获得待处理语音信号特征数据;
通过预设统计函数对所述待处理语音信号特征数据进行特征统计,获得待确认特征统计结果;
根据所述待确认特征统计结果,通过预设多目标优化算法获得特征目标数据;
将所述特征目标数据输入至预设Softmax分类模型中,获得语音情感识别结果。


2.如权利要求1所述的方法,其特征在于,所述获取预设维度的测试语音样本,并通过预设规则对所述测试语音样本进行分段处理,获得多个初始语音样本的步骤之前,还包括:
获取预设维度的训练语音样本,并通过预设规则对所述测试语音样本进行分段处理,获得多个初始训练语音样本;
对所述初始训练语音样本进行特征提取,获得待处理训练语音信号特征;
通过预设统计函数对所述待处理训练语音信号特征进行特征统计,获取待确认训练特征统计结果;
根据所述待确认训练特征统计结果,通过预设多目标优化算法获得目标训练特征数据;
根据所述目标训练特征数据获取所述目标训练特征数据对应的情感类别;
根据所述情感类别和所述情感类别对应的目标训练特征数据建立预设Softmax分类模型。


3.如权利要求2所述的方法,其特征在于,所述根据所述待确认训练特征统计结果,通过预设多目标优化算法获得目标训练特征数据的步骤,包括:
对所述待确认训练特征统计结果进行情感类别划分,获得不同情感类别对应的待优化训练特征数据;
根据所述待优化训练特征数据,通过预设多目标优化算法获得目标训练特征数据。


4.如权利要求2所述的方法,其特征在于,所述将所述特征目标数据输入至预设Softmax分类模型中,获得语音情感识别结果的步骤,包括:
将所述特征目标数据输入至所述预设Softmax分类模型中,获得语音情感类别数据;
对所述语音情感类别数据进行数据统计,获得语音情感类别数据值;
根据所述语音情感类别数据值获得语音情感识别结果。

【专利技术属性】
技术研发人员:孙亚新叶青
申请(专利权)人:湖北文理学院
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1