基于层级多语音学特征融合模型的精神状态检测方法技术

技术编号：32222448 阅读：9 留言：0更新日期：2022-02-09 17:27

本发明专利技术公开了一种基于层级多语音学特征融合模型的精神状态检测方法，包括对原始语音数据进行预处理，以及语音学特征提取，得到语音学特征集；根据得到的语音学特征集输入建立的层级融合模型，进行特征水平融合和回答水平融合，得到所有样本的特征表示；将得到的样本的特征表示输入分类器进行样本的精神状态判定。本发明专利技术通过建立层级融合模型，利用设计的卷积神经网络从不同语音学特征中挖掘与精神状态相关的深度特征。并结合通道感知和经典的注意力机制，从特征的局部通道上以及不同特征全局水平上分配不同的权重，学习出不同特征不同的重要性，以及对不同的回答片段学习不同的权值，从而减少数据冗余对于检测效果的影响。从而减少数据冗余对于检测效果的影响。从而减少数据冗余对于检测效果的影响。

全部详细技术资料下载

【技术实现步骤摘要】
基于层级多语音学特征融合模型的精神状态检测方法

[0001]本专利技术涉及精神状态检测
，特别涉及一种基于层级多语音学特征融合模型的精神状态检测方法。

技术介绍

[0002]近年来，随着提升社会治安治理能力的需要，公安系统往往需要对嫌疑人做初步的精神鉴定，因此自动精神状态检测技术可以为精神鉴定提供帮助。鉴于公安系统往往会对嫌疑人采取问答式的记录，利用问答式的语音数据来检测精神状态成为了本专利技术关注的重点。
[0003]然而现有的基于语音信号建模的精神状态检测技术利用传统的分类器难以从不同样本的语音信号中区分出某种精神状态呈阳性或者是阴性。随着深度学习技术的发展，使用深度神经网络对从语音信号中提取的语音学特征挖掘出精神状态相关的深层特征表达成为了主流方法。然而一方面不同的语音学特征从不同角度反映了语音信号的特性，仅用少量的特征对于精神状态的检测来说可能会导致偏差从而影响检测效果，如何更好地利用多个不同种类语音学特征之间的互补性，构建融合模型提升精神状态检测能力是一个尚待解决的问题。另一方面由于精神状态检测中问答式的语音数据往往比较冗长，现有技术的不足之处在于，直接对全局信息建模会导致模型参数过大，并且难以从中挖掘出精神状态相关的特征表示，简单地将语音信号等长分割虽然一定程度上扩充了数据量，但是每个分段数据无法表示每个样本，且不同问题回答对于精神状态的检测不一定相关性很高，造成数据存在一定的冗余性。

技术实现思路

[0004]本专利技术的目的克服现有技术存在的不足，为实现以上目的，采用一种...

【技术保护点】

【技术特征摘要】
1.一种基于层级多语音学特征融合模型的精神状态检测方法，其特征在于，包括：对原始语音数据进行预处理，以及语音学特征提取，得到语音学特征集；根据得到的语音学特征集输入建立的层级融合模型，进行特征水平融合和回答水平融合，得到所有样本的特征表示；将得到的样本的特征表示输入分类器进行样本的精神状态判定。2.根据权利要求1所述一种基于层级多语音学特征融合模型的精神状态检测方法，其特征在于，所述数据预处理以及语音学特征提取，得到语音特征集的具体步骤包括：建立精神状态检测任务，得到映射函数f，所述映射函数f的预测结果y
i
为：y
i
＝f(x
i
),y
i
∈{0,1}；其中，y
i
＝1表示精神状态呈阳性，y
i
＝0表示精神状态呈阴性；将原始语音数据根据被问问题的回答部分分割成若干个语音数据片段；根据得到的若干个语音数据片段进行样本信息定义：x
i
＝{Q1,A1,
…
,Q
j
,A
j
,
…
,Q
n
,A
n
}；其中，n表示问题的数量、Q
j
(j∈[1,n])表示每个样本x
i
中的第j个问题、A
j
(j∈[1,n])表示每个样本x
i
中对应于Q
j
的第j个回答；根据若干个被问问题Q
j
移除问题片段，得到仅保留回答片段的样本x
i
′
为：x
i
′
＝{A1,
…
,A
j
,
…
,A
n
}；根据回答片段A
j
提取语音学特征集H
j
，...

【专利技术属性】
技术研发人员：郭艳蓉，周致远，郝世杰，洪日昌，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人