System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度学习的精神分裂症语音检测方法及系统技术方案_技高网

一种基于深度学习的精神分裂症语音检测方法及系统技术方案

技术编号:40014301 阅读:7 留言:0更新日期:2024-01-16 15:45
本发明专利技术公开了一种基于深度学习的精神分裂症语音检测方法及系统,涉及个人健康风险评估技术领域,所述方法包括:获取受试者人群的认知测试语音样本,集成希尔伯特黄变换和倒谱内插方法提取语音样本的声学特征参数集,声学特征参数集包括音质情感变化特征;构建声学特征参数集的语音向量,根据语音向量训练多尺度多头精神分裂症语音检测模型,其中,语音向量包括音节、音素、音位以及语素单元的隐含状态序列;利用多尺度多头精神分裂症语音检测模型对受检者的语音进行自动分类检测,输出受检者的人群类别。本发明专利技术集成希尔伯特黄变换和倒谱内插方法提取声学特征,利用多尺度多头精神分裂症语音检测模型对受检者的语音进行自动分类检测。

【技术实现步骤摘要】

本专利技术涉及个人健康风险评估,具体涉及一种基于深度学习的精神分裂症语音检测方法及系统


技术介绍

1、精神分裂症是一种慢性神经退化性障碍,具有复发率高、致残率高等特点,常伴随患者终生,严重损害了患者的生活质量和社会认知,其主要临床表现包含幻听、妄想、言语(思维)紊乱、行为异常、阴性症状(如语言贫乏、情感淡漠等)。若能在精神症状发作的早期采取合理有效的自动检测手段,及时加以干预治疗,将有助于改善患者的病况。

2、目前精神分裂症的临床诊断和监测评估的方法主要有以下几种方式:一是脑影像学方法,通过功能核磁共振(functional nuclear magnetic resonance,fmri)诊断脑实质及脑功能的改变,但仪器操作复杂,检测费用高昂,且缺乏客观的生物学标记;二是脑电信号方法,但α波、β波均无特异性,对诊断的价值有限;三是视频分析方法,相比于正常人,精神分裂症患者具有更少的身体运动和更呆滞的面部表情,可以通过分析提取受试者的表情动作特征实现自动检测,但目前的研究瓶颈在于缺乏统一的实验范式,尚处于起步阶段,未达到临床辅助诊断水平;四是基因组学方法,但在基因测序捕捉时仍存在假阳性和假阴性的问题。

3、研究表明精神分裂症的阴性症状与语音情感表达密切相关,随着大数据、人工智能、语音信号处理算法的飞速发展,将语音情感特征应用于精神分裂症的研究,将为临床诊断精神分裂症提供全新的检测方法。


技术实现思路

1、鉴于上述问题,提出了本专利技术以便提供一种克服上述全部或至少一部分问题的基于深度学习的精神分裂症语音检测方法及系统。

2、根据本专利技术的一个方面,提供了一种基于深度学习的精神分裂症语音检测方法,包括:

3、获取受试者人群的认知测试语音样本,集成希尔伯特黄变换和倒谱内插方法提取所述语音样本的声学特征参数集,其中,所述受试者人群包括精神分裂症首发、高危、超高危和正常对照组四类人群,所述声学特征参数集包括音质情感变化特征;

4、构建所述声学特征参数集的语音向量,根据所述语音向量训练多尺度多头精神分裂症语音检测模型,其中,所述语音向量包括音节、音素、音位以及语素单元的隐含状态序列;

5、利用所述多尺度多头精神分裂症语音检测模型对受检者的语音进行自动分类检测,输出所述受检者的人群类别;

6、所述集成希尔伯特黄变换和倒谱内插方法提取所述语音样本的声学特征参数集包括:

7、在所述语音向量中加入均值与方差具有相同分布的不同噪声,合成目标语音信号;

8、计算模态函数中各个imf分量对应的边际谱的频带能熵比的比值,筛选出包含共振峰的imf分量,以重构所述语音向量;

9、利用倒谱内插方法提取多个所述共振峰的声学特征参数集,其中,所述声学特征参数集包括各个共振峰频率、带宽、幅值对应的峰值数、均值、方差、中位数、众数、极差、偏度以及峭度。

10、更进一步地,对所述多尺度多头精神分裂症语音检测模型的优化函数进行范数优化,所述范数的具体公式为:

11、

12、其中,…为向量参数。

13、更进一步地,所述优化函数采用rmsprop算法,根据学习率和修正矩阵偏差更新所述rmsprop算法的参数变化量,所述参数变化量更新的具体公式为:

14、

15、其中,为参数变量量,为学习率,为超参数,为一阶修正偏差,为二阶修正偏差。

16、更进一步地,所述一阶修正偏差的具体公式为:

17、

18、其中,为一阶系数,s为一阶矩估计,t为时间步长;

19、所述二阶修正偏差的具体公式为:

20、

21、其中,为二阶系数,为二阶矩估计。

22、更进一步地,所述多尺度多头精神分裂症语音检测模型的损失函数为:

23、

24、其中,k为第k个词,k为词的个数,为语音向量中词的序号,为序列模型解码器第k个词的概率,为前一个词的序号,为上下文信息,x为上下文向量特征。

25、更进一步地,所述多尺度多头精神分裂症语音检测模型中各个卷积网络模块包括一维卷积、门控单元激活和随机失活操作;

26、所述一维卷积运算的具体公式为:

27、

28、其中,s(t)为卷积运算结果,u,v为自变量为t的函数,a是累加变量;

29、所述门控单元激活的具体公式为:

30、

31、其中,k为当前网络层的输入,f、g为卷积核,为激活函数,b、c为偏置参数。

32、更进一步地,所述方法还包括:

33、将所述认知测试语音样本划分为长度为3秒的片段,分别提取所述片段的基因频率、响度、频谱通量、能量以及尖锐度。

34、更进一步地,在所述根据所述语音向量训练多尺度多头精神分裂症语音检测模型之前,所述方法还包括:

35、对所述语音向量进行归一化,使用的归一化函数具体为:

36、

37、其中,、分别为语音向量列中的最小值及最大值,为归一化后的各元素的值。

38、根据本专利技术的另一方面,提供了一种基于深度学习的精神分裂症语音检测系统,包括:

39、语音获取模块,用于获取受试者人群的认知测试语音样本,集成希尔伯特黄变换和倒谱内插方法提取所述语音样本的声学特征参数集,其中,所述受试者人群包括精神分裂症首发、高危、超高危和正常对照组四类人群,所述声学特征参数集包括音质情感变化特征;

40、模型训练模块,用于构建所述声学特征参数集的语音向量,根据所述语音向量训练多尺度多头精神分裂症语音检测模型,其中,所述语音向量包括音节、音素、音位以及语素单元的隐含状态序列;

41、分类检测模块,用于利用所述多尺度多头精神分裂症语音检测模型对受检者的语音进行自动分类检测,输出所述受检者的人群类别。

42、根据本专利技术提供的方案,获取受试者人群的认知测试语音样本,集成希尔伯特黄变换和倒谱内插方法提取所述语音样本的声学特征参数集,其中,所述受试者人群包括精神分裂症首发、高危、超高危和正常对照组四类人群,所述声学特征参数集包括音质情感变化特征;构建所述声学特征参数集的语音向量,根据所述语音向量训练多尺度多头精神分裂症语音检测模型,其中,所述语音向量包括音节、音素、音位以及语素单元的隐含状态序列;利用所述多尺度多头精神分裂症语音检测模型对受检者的语音进行自动分类检测,输出所述受检者的人群类别。本专利技术集成希尔伯特黄变换和倒谱内插方法提取声学特征,利用多尺度多头精神分裂症语音检测模型对受检者的语音进行自动分类检测,为临床诊断精神分裂症提供全新的检测方法。

43、本专利技术的技术效果:

44、(1)通过集成希尔伯特黄变换和倒谱内插方法所提取的声学特征,尤其是针对非稳态与非线性信号,在频域各频率分量的幅度保持不变,不仅去除了干扰噪音,使得声学特本文档来自技高网...

【技术保护点】

1.一种基于深度学习的精神分裂症语音检测方法,其特征在于,包括:

2.根据权利要求1所述的基于深度学习的精神分裂症语音检测方法,其特征在于,对所述多尺度多头精神分裂症语音检测模型的优化函数进行范数优化,所述范数的具体公式为:

3.根据权利要求2所述的基于深度学习的精神分裂症语音检测方法,其特征在于,所述优化函数采用RMSProp算法,根据学习率和修正矩阵偏差更新所述RMSProp算法的参数变化量,所述参数变化量更新的具体公式为:

4.根据权利要求3所述的基于深度学习的精神分裂症语音检测方法,其特征在于,所述一阶修正偏差的具体公式为:

5.根据权利要求1所述的基于深度学习的精神分裂症语音检测方法,其特征在于,所述多尺度多头精神分裂症语音检测模型的损失函数为:

6.根据权利要求1所述的基于深度学习的精神分裂症语音检测方法,其特征在于,所述多尺度多头精神分裂症语音检测模型中各个卷积网络模块包括一维卷积、门控单元激活和随机失活操作;

7.根据权利要求1所述的基于深度学习的精神分裂症语音检测方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的基于深度学习的精神分裂症语音检测方法,其特征在于,在所述根据所述语音向量训练多尺度多头精神分裂症语音检测模型之前,所述方法还包括:

9.一种基于深度学习的精神分裂症语音检测系统,该系统基于如权利要求1-8任一项所述的基于深度学习的精神分裂症语音检测方法,其特征在于,包括:

...

【技术特征摘要】

1.一种基于深度学习的精神分裂症语音检测方法,其特征在于,包括:

2.根据权利要求1所述的基于深度学习的精神分裂症语音检测方法,其特征在于,对所述多尺度多头精神分裂症语音检测模型的优化函数进行范数优化,所述范数的具体公式为:

3.根据权利要求2所述的基于深度学习的精神分裂症语音检测方法,其特征在于,所述优化函数采用rmsprop算法,根据学习率和修正矩阵偏差更新所述rmsprop算法的参数变化量,所述参数变化量更新的具体公式为:

4.根据权利要求3所述的基于深度学习的精神分裂症语音检测方法,其特征在于,所述一阶修正偏差的具体公式为:

5.根据权利要求1所述的基于深度学习的精神分裂症语音检测方法,其特征在于,...

【专利技术属性】
技术研发人员:赵玉丽梁伟业杨敬铭范宁赵文暄
申请(专利权)人:北京回龙观医院北京心理危机研究与干预中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1