基于PSO动态搜索分类网络的帕金森语音识别方法及装置制造方法及图纸

技术编号:35936424 阅读:57 留言:0更新日期:2022-12-14 10:23
本发明专利技术公开了一种基于PSO动态搜索分类网络的帕金森语音识别方法及装置,方法包括:获取帕金森患者的语音数据,对语音数据进行剪辑,从剪辑好的语音数据中提取语音特征,制备语音特征数据集;初始化动态搜索分类网络的参数,随机初始化生成分类网络粒子群;使用语音特征数据集训练每代分类网络粒子群中的分类网络,得到各个粒子的适应度函数值,根据各个粒子的适应度函数值更新分类网络粒子群,循环训练更新分类网络直至得到最优分类网络,基于训练所得的最优分类网络,对待识别的语音特征数据进行帕金森语音识别。数据进行帕金森语音识别。数据进行帕金森语音识别。

【技术实现步骤摘要】
基于PSO动态搜索分类网络的帕金森语音识别方法及装置


[0001]本专利技术是一种基于PSO(粒子群优化算法)动态搜索分类网络结构的帕金森语音识别方法,涉及智慧医疗技术。

技术介绍

[0002]帕金森氏症是一种神经系统疾病,由大脑中产生多巴胺的细胞丧失引起,从而损害大脑功能。随着患者病情的加重,大脑和身体不同部位的协调会出现问题。近90%的帕金森氏症患者在早期就表现出发声障碍的症状,而且,帕金森病患者的语音信号与正常人相比有很大的差异和变化。因此,语音信号被用来辅助诊断帕金森。目前,帕金森语音分类常见的方法有支持向量机、随机森林、多层感知机、神经网络等等。
[0003]上述方法在针对某一类语音信号的帕金森分类上取得了较大进展,但是,这些方法大都是根据某一类语音信号提取语音信号常见特征,针对性的设置分类器,方法并不具备普适性。

技术实现思路

[0004]本专利技术所需要解决的问题在于不同语言、不同内容的语音信号给帕金森语音识别带来的困难,本专利技术提供一种基于PSO动态搜索分类网络结构的帕金森语音识别方法。
[0005]技术方案:为解决上述技术问题,本专利技术采用的技术方案为:
[0006]第一方面,提供一种帕金森语音识别方法,包括:
[0007]步骤(1)、获取帕金森患者的语音数据;
[0008]步骤(2)、对获取的语音数据进行剪辑处理,得到剪辑后的语音数据;
[0009]步骤(3)、对剪辑后的语音数据提取语音特征,得到语音特征数据集;
[0010]步骤(4)、通过预设的动态搜索分类网络的参数,随机初始化生成分类网络粒子群;
[0011]步骤(5)、利用语音特征数据集对分类网络粒子群进行迭代训练、更新,得到训练更新好的动态搜索分类网络模型;
[0012]步骤(6)、将待识别的语音特征数据输入训练更新好的动态搜索分类网络模型,根据所述动态搜索分类网络模型的输出,确定帕金森语音识别结果。
[0013]在一些实施例中,所述步骤(1),获取帕金森患者的语音数据,包括:
[0014]所述帕金森患者的语音数据,包括伦敦国王学院早期和晚期帕金森患者 (MDVR

KCL)语音数据集、健康对照者的语音数据集和/或意大利帕金森语音数据集;
[0015]其中所述MDVR

KCL早期和晚期帕金森患者和健康对照者的语音数据集语言为英语,内容为两段文本的朗读语音;
[0016]其中所述意大利帕金森语音数据集内容为单音节发音数据,包括

a
’‘
i
’‘
e
’‘
o
’‘
u
’‘
ta
’‘
pa

音节的重复发音。
[0017]在一些实施例中,所述步骤(2)中,对获取的语音数据进行剪辑处理,包括:
[0018]对于MDVR

KCL早期和晚期帕金森患者和健康对照者的语音数据集,按照朗读文本的断句进行剪辑,同时剔除停顿的空白语音片段;
[0019]对于意大利帕金森语音数据集,剪辑每个音节发音片段,剔除暂停过程中的空白语音片段。
[0020]在一些实施例中,步骤(3),对剪辑后的语音数据提取语音特征,得到语音特征数据集,包括:
[0021]所述语音特征数据集中包括26个语音基本特征、梅尔倒谱系数特征和13 个全局特征:
[0022]使用Praat声学分析软件从每个语音信号中提取一组26个语音基本特征;
[0023]基于短时傅里叶变换,使用梅尔滤波器组提取语音信号的梅尔倒谱系数特征;
[0024]对于语音信号,提取包括平均值、中位数、均方根、平方、最大值、最小值、第一和第三个四分位数、四分位数范围、标准差、偏度和峰度13个全局特征。
[0025]在一些实施例中,步骤(4),通过预设的动态搜索分类网络的参数,随机初始化生成分类网络粒子群,包括:初始化种群大小为20,迭代次数为10,分类网络层数范围为[3,10],对于分类网络要求第一层必须是卷积层,最后一层必须是完全连接层,随机初始化分类网络粒子群中每个分类网络的结构,分类网络粒子群训练时,主循环次数为10。
[0026]在一些实施例中,步骤(5)、利用语音特征数据集对分类网络粒子群进行迭代训练、更新,得到训练更新好的动态搜索分类网络模型;
[0027]利用语音特征数据集对每一代分类网络粒子群中的分类网络进行训练,得到各个粒子的适应度函数值;根据各个粒子的适应度函数值更新分类网络粒子群,循环迭代执行该步骤直至满足迭代停止条件,得到一个最优分类网络,作为动态搜索分类网络模型。
[0028]进一步地,利用语音特征数据集对每一代分类网络粒子群中的分类网络进行训练,得到各个粒子的适应度函数值,包括:
[0029]使用所述语音特征数据集分别训练分类网络粒子群中的各个分类网络,计算损失函数,并利用损失函数对分类网络粒子群进行评估得到各个粒子的适应度函数值,根据各个粒子的适应度函数值与全局最佳分类网络和当前粒子最佳分类网络的适应度函数值比较的结果,更新全局最佳分类网络和当前粒子最佳分类网络,根据全局最佳分类网络和当前粒子最佳分类网络更新分类网络粒子群。
[0030]在一些实施例中,其中分类网络更新的方法包括:通过比较网络结构之间的差异,计算当前粒子的速度v,按照下面的公式更新分类网络结构:
[0031]v
i
=v
i
+c1×
rand()
×
(pbest
i

x
i
)+c2×
rand()
×
(gbest
i

x
i
)
[0032]x
i
=x
i
+v
i
[0033]其中,gbest
i
是全局最佳分类网络,pbest
i
是当前粒子最佳分类网络,i=1,2,

, N是该组中的粒子总数,v
i
是粒子的速度,x
i
是粒子的当前位置,c1和c2是学习因子,而rand()是(0,1)之间的随机数。
[0034]第二方面,本专利技术提供了一种帕金森语音识别装置,包括处理器及存储介质;
[0035]所述存储介质用于存储指令;
[0036]所述处理器用于根据所述指令进行操作以执行根据第一方面所述方法的步骤。
[0037]第三方面,本专利技术提供了一种存储介质,其上存储有计算机程序,所述计算机程序
被处理器执行时实现第一方面所述方法的步骤。
[0038]本专利技术所达到的有益效果:
[0039]本专利技术提出一种基于PSO(粒子群优化算法)动态搜索分类网络结构的帕金森语音识别方法。使用不同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种帕金森语音识别方法,其特征在于,包括:步骤(1)、获取帕金森患者的语音数据;步骤(2)、对获取的语音数据进行剪辑处理,得到剪辑后的语音数据;步骤(3)、对剪辑后的语音数据提取语音特征,得到语音特征数据集;步骤(4)、通过预设的动态搜索分类网络的参数,随机初始化生成分类网络粒子群;步骤(5)、利用语音特征数据集对分类网络粒子群进行迭代训练、更新,得到训练更新好的动态搜索分类网络模型;步骤(6)、将待识别的语音特征数据输入训练更新好的动态搜索分类网络模型,根据所述动态搜索分类网络模型的输出,确定帕金森语音识别结果。2.根据权利要求1所述的帕金森语音识别方法,其特征在于,获取帕金森患者的语音数据,包括:所述帕金森患者的语音数据,包括伦敦国王学院MDVR

KCL早期和晚期帕金森患者语音数据集、健康对照者的语音数据集和/或意大利帕金森语音数据集;其中所述MDVR

KCL早期和晚期帕金森患者语音数据集、健康对照者的语音数据集语言为英语,内容为两段文本的朗读语音;其中所述意大利帕金森语音数据集内容为单音节发音数据,包括

a
’‘
i
’‘
e
’‘
o
’‘
u
’‘
ta
’‘
pa

音节的重复发音。3.根据权利要求1所述的帕金森语音识别方法,其特征在于,对获取的语音数据进行剪辑处理,包括:对于MDVR

KCL早期和晚期帕金森患者和健康对照者的语音数据集,按照朗读文本的断句进行剪辑,同时剔除停顿的空白语音片段;对于意大利帕金森语音数据集,剪辑每个音节发音片段,剔除暂停过程中的空白语音片段。4.根据权利要求1所述的帕金森语音识别方法,其特征在于,对剪辑后的语音数据提取语音特征,得到语音特征数据集,包括:所述语音特征数据集中包括26个语音基本特征、梅尔倒谱系数特征和13个全局特征:使用Praat声学分析软件从每个语音信号中提取一组26个语音基本特征;基于短时傅里叶变换,使用梅尔滤波器组提取语音信号的梅尔倒谱系数特征;对于语音信号,提取包括平均值、中位数、均方根、平方、最大值、最小值、第一和第三个四分位数、四分位数范围、标准差、偏度和峰度13个全局特征。5.根据权利要求1所述的帕金森语音识别方法,其特征在于,通过预设的动态搜索分类网络的参数,随机初始化生成分类网络粒子群,包括:初始化种群大小为20,迭代次数为10,分类网络层数范围为[3,10],对于分类网络要求第一层必须是卷积层,最后一层必须是完全连接层,随机...

【专利技术属性】
技术研发人员:高浩甘燕燕徐枫郭怡菁袁杰
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1