情感识别方法及其装置、计算机设备、存储介质制造方法及图纸

技术编号:33027086 阅读:15 留言:0更新日期:2022-04-15 09:01
本公开实施例提供一种情感识别方法及其装置、计算机设备、存储介质,属于计算机信息处理技术领域,所述方法包括:获取音频信号;对所述音频信号进行分帧处理,得到多个分帧信号,提取多个所述分帧信号的声学特征;根据所述声学特征构建第一特征矩阵;获取所述声学特征对应的情感打分值;根据所述情感打分值构建第二特征矩阵;根据所述第一特征矩阵和所述第二特征矩阵从多个所述声学特征中选择目标声学特征;根据所述目标声学特征构建情感预测模型,根据所述情感预测模型进行情感识别,原理简单,计算量小,音频信号的情感识别无需人工操作,减少了人工对音频的情感标注工作,情感识别的准确率高。别的准确率高。别的准确率高。

【技术实现步骤摘要】
情感识别方法及其装置、计算机设备、存储介质


[0001]本专利技术涉及计算机信息处理
,尤其涉及一种情感识别方法及其装置、计算机设备、存储介质。

技术介绍

[0002]目前基于音频特征的情感识别方法都是提取底层的音频特征,忽略了情感随时间变化的特点,也没有考虑情感分布情况,导致声学特征与情感关联性不强。因此,如何提取与情感相关的声学特征对音乐情感识别起到至关重要的作用。

技术实现思路

[0003]本公开实施例的主要目的在于提出一种情感识别方法及其装置、计算机设备、存储介质,能够提取与情感相关的声学特征以进行情感识别。
[0004]为实现上述目的,本公开实施例的第一方面提出了一种情感识别方法,所述方法包括:
[0005]获取音频信号;
[0006]对所述音频信号进行分帧处理,得到多个分帧信号,提取多个所述分帧信号的声学特征;
[0007]根据所述声学特征构建第一特征矩阵;
[0008]获取所述声学特征对应的情感打分值;
[0009]根据所述情感打分值构建第二特征矩阵;
[0010]根据所述第一特征矩阵和所述第二特征矩阵从多个所述声学特征中选择目标声学特征;
[0011]根据所述目标声学特征构建情感预测模型,根据所述情感预测模型进行情感识别。
[0012]在一些实施例,所述根据所述第一特征矩阵和所述第二特征矩阵从多个所述声学特征中选择目标声学特征,包括:
[0013]根据第一特征矩阵和第二特征矩阵计算第一得分,根据所述第一特征矩阵计算第二得分;
[0014]根据所述第一得分和所述第二得分从多个声学特征中选择目标声学特征。
[0015]在一些实施例,所述根据第一特征矩阵和第二特征矩阵计算第一得分,根据所述第一特征矩阵计算第二得分,包括:
[0016]计算第一特征矩阵和第二特征矩阵的相似度参数;
[0017]根据所述相似度参数计算第一得分;
[0018]根据第一特征矩阵计算相异度参数;
[0019]根据所述相异度参数计算第二得分。
[0020]在一些实施例,所述根据所述第一得分和所述第二得分从多个声学特征中选择目
标声学特征,包括:
[0021]获取第一预设参数和第二预设参数;
[0022]根据第一得分和所述第一预设参数得到第三得分;
[0023]根据第二得分和所述第二预设参数得到第四得分;
[0024]根据所述第三得分和所述第四得分得到目标得分;
[0025]根据所述目标得分从多个声学特征中选择目标声学特征。
[0026]在一些实施例,所述对所述音频信号进行分帧处理,得到多个分帧信号,提取多个所述分帧信号的声学特征,包括:
[0027]通过交叠分段和预设的窗函数,对音频信号进行分帧处理,得到多个分帧信号;
[0028]提取多个所述分帧信号的短时特征,根据所述短时特征得到多个所述分帧信号的声学特征;
[0029]其中,所述短时特征包括短时平均幅度、短时门限过零率和短时功率谱。
[0030]在一些实施例,所述根据所述目标声学特征构建情感预测模型,包括:
[0031]根据目标声学特征构建最优特征集;
[0032]根据所述最优特征集构建第一回归方程和第二回归方程;
[0033]根据所述第一回归方程和所述第二回归方程构建情感预测模型。
[0034]在一些实施例,所述根据目标声学特征构建最优特征集,包括:
[0035]获取目标声学特征,并将所述目标声学特征存入数组;
[0036]根据所述数组中的元素构建最优特征集。
[0037]本公开实施例的第二方面提出了一种情感识别装置,所述装置包括:
[0038]第一获取模块,用于获取音频信号;
[0039]第一特征提取模块,用于对所述音频信号进行分帧处理,得到多个分帧信号,提取多个所述分帧信号的声学特征;
[0040]第一特征计算模块,用于根据所述声学特征构建第一特征矩阵;
[0041]第二获取模块,用于获取所述声学特征对应的情感打分值;
[0042]第二特征计算模块,用于根据所述情感打分值构建第二特征矩阵;
[0043]第二特征提取模块,用于根据所述第一特征矩阵和所述第二特征矩阵从多个所述声学特征中选择目标声学特征;
[0044]情感识别模块,用于根据所述目标声学特征构建情感预测模型,根据所述情感预测模型进行情感识别。
[0045]本公开实施例的第三方面提出了一种计算机设备,所述计算机设备包括存储器和处理器,其中,所述存储器中存储有程序,所述程序被所述处理器执行时所述处理器用于执行如本申请第一方面实施例任一项所述的方法。
[0046]本公开实施例的第四方面提出了一种存储介质,该存储介质为计算机可读存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如本申请第一方面实施例任一项所述的方法。
[0047]本公开实施例提出的情感识别方法及其装置、计算机设备、存储介质,获取音频信号,对音频信号进行分帧处理,得到多个分帧信号,提取多个分帧信号的声学特征,通过分帧提取音频信号中与时间有关的声学特征来体现情感随时间变化的特点,根据声学特征构
建第一特征矩阵,通过获取声学特征对应的情感打分值,根据情感打分值构建第二特征矩阵,根据第一特征矩阵和第二特征矩阵从多个声学特征中选择目标声学特征,使声学特征与情感相关,能够提取与情感相关的声学特征即目标声学特征,根据目标声学特征建立情感预测模型,根据情感预测模型进行情感识别,原理简单,计算量小,音频信号的情感识别无需人工操作,减少了人工对音频的情感标注工作。
附图说明
[0048]图1是本公开实施例提供的情感识别方法的第一流程图;
[0049]图2是图1中的步骤S160的流程图;
[0050]图3是图2中的步骤S210的流程图;
[0051]图4是图2中的步骤S220的流程图;
[0052]图5是图1中的步骤S120的流程图;
[0053]图6是图1中的步骤S170的流程图;
[0054]图7是本公开实施例提供的情感识别方法的第二流程图;
[0055]图8是本公开实施例提供的情感识别装置的模块结构图。
具体实施方式
[0056]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[0057]需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.情感识别方法,其特征在于,所述方法包括:获取音频信号;对所述音频信号进行分帧处理,得到多个分帧信号,提取多个所述分帧信号的声学特征;根据所述声学特征构建第一特征矩阵;获取所述声学特征对应的情感打分值;根据所述情感打分值构建第二特征矩阵;根据所述第一特征矩阵和所述第二特征矩阵从多个所述声学特征中选择目标声学特征;根据所述目标声学特征构建情感预测模型,根据所述情感预测模型进行情感识别。2.根据权利要求1所述的情感识别方法,其特征在于,所述根据所述第一特征矩阵和所述第二特征矩阵从多个所述声学特征中选择目标声学特征,包括:根据第一特征矩阵和第二特征矩阵计算第一得分,根据所述第一特征矩阵计算第二得分;根据所述第一得分和所述第二得分从多个声学特征中选择目标声学特征。3.根据权利要求2所述的情感识别方法,其特征在于,所述根据第一特征矩阵和第二特征矩阵计算第一得分,根据所述第一特征矩阵计算第二得分,包括:计算第一特征矩阵和第二特征矩阵的相似度参数;根据所述相似度参数计算第一得分;根据第一特征矩阵计算相异度参数;根据所述相异度参数计算第二得分。4.根据权利要求2所述的情感识别方法,其特征在于,所述根据所述第一得分和所述第二得分从多个声学特征中选择目标声学特征,包括:获取第一预设参数和第二预设参数;根据第一得分和所述第一预设参数得到第三得分;根据第二得分和所述第二预设参数得到第四得分;根据所述第三得分和所述第四得分得到目标得分;根据所述目标得分从多个声学特征中选择目标声学特征。5.根据权利要求1所述的情感识别方法,其特征在于,所述对所述音频信号进行分帧处理,得到多个分帧信号,提取多个所述分帧信号的声学特征,包括:通过交叠分段和预设的窗函数,对音频信号进行分帧处理,得到多个...

【专利技术属性】
技术研发人员:李海峰薄洪健马琳丰上徐聪李洪伟孙聪珊徐忠亮丁施航
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1