一种早期阿尔茨海默症识别系统及装置制造方法及图纸

技术编号:33084222 阅读:13 留言:0更新日期:2022-04-15 10:44
本发明专利技术公开了一种早期阿尔茨海默症识别系统及装置,涉及病症识别技术。针对现有技术中该病识别运算要求巨大的问题提出本方案,提取语音信号的基频信息,确定语音信号中说话开始的时刻和结束的时刻;对每一说话开始的时刻和结束的时刻均取其前后各一时长的语音信号生产一个对应的语音小段信号Seg,获取每个语音小段信号Seg的语谱图;得到每一个语音小段信号的最终特征;进行整段语音信号的特征向量提取;对整段语音信号的特征向量进行识别,输出识别结果。优点在于,降低整体系统的参数量与计算量,提高识别速度,尤其适合社区活动中基层人员的普查摸底工作。基层人员的普查摸底工作。基层人员的普查摸底工作。

【技术实现步骤摘要】
一种早期阿尔茨海默症识别系统及装置


[0001]本专利技术涉及病症识别技术,尤其涉及一种早期阿尔茨海默症识别系统及装置。

技术介绍

[0002]阿尔茨海默症是一种神经系统疾病,其起病隐匿,常见于70岁以上老年人,故又称为老年痴呆症。阿尔茨海默症患者在生活中常表现为:记忆障碍,语言障碍,视觉空间障碍,计算障碍等。目前,全球约有5000万人患有阿尔茨海默症,平均不到3秒就有一个新发病例。中国的阿尔茨海默症患者接近1500万,人数居全球首位。随着人口老龄化的加剧,阿尔茨海默症也越来越引起人们重视。虽然阿尔茨海默症一旦确诊就无法治愈,但如果能在其发病的前期,即还处于早期阶段时尽早发现并尽早治疗,能够有效地延缓病情发展。因此,如何及时发现早期阿尔茨海默症患者成为了研究的重点。
[0003]目前通过医疗手段进行阿尔茨海默症的诊断,需要专业的医疗检测仪器,且流程复杂、价格较高,不适用于老年人社区的大规模筛查。目前使用传统的机器学习方法如支持向量机与朴素贝叶斯算法等,识别效果不佳。目前使用深度学习的方法,直接采用语音的通用特征,没有对阿尔茨海默症识别这一特殊任务对特征进行优化,同时直接对整段音频进行建模,不仅导致模型的参数量大与计算量大,识别速度慢,也不能突出整段语音中的关键部分。因此有必要开发一种适合大规模筛查、使用简便且高效的快速阿尔茨海默症识别系统。

技术实现思路

[0004]本专利技术目的在于提供一种早期阿尔茨海默症识别系统及装置,以解决上述现有技术存在的问题。
[0005]本专利技术所述一种早期阿尔茨海默症识别系统,包括依次信号连接的语音信号采集模块、语音特征提取模块、局部特征建模模块、全局关系建模模块和识别模块;
[0006]所述的语音特征提取模块在接收语音信号后进行以下操作:
[0007]提取语音信号每一时刻的基频信息,确定语音信号中说话开始的时刻和结束的时刻;
[0008]对每一说话开始的时刻和结束的时刻均取其前后各一时长的语音信号生产一个对应的语音小段信号Seg,获取每个语音小段信号Seg的语谱图;
[0009]使用N个临界频带滤波器对所述语谱图进行滤波得到对应的N个临界频带子带能量特征;
[0010]提取语音小段信号Seg的12维的梅尔频率倒谱系数、12维的一阶差分特征以及12维的二阶差分特征;
[0011]将临界频带子带能量特征、梅尔频率倒谱系数、一阶差分特征以及二阶差分特征进行拼接,得到每一个语音小段信号的最终特征;
[0012]所述的局部特征建模模块接收所述最终特征并进行局部特征向量提取;
[0013]所述的全局关系建模模块接收局部特征向量并进行整段语音信号的特征向量提取;
[0014]所述的识别模块接收整段语音信号的特征向量进行识别,输出识别结果;
[0015]所述识别结果为所述语音信号是否与早期阿尔茨海默症的语音特性相匹配。
[0016]确定语音信号中说话开始的时刻和结束的时刻的具体操作为:
[0017]根据基频信息,利用公式获取语音信号的标记向量;其中P
t
为语音信号t时刻的基频,为语音信号的标记向量,t为输入语音信号的时间长度下标;
[0018]根据标记向量,利用公式计算临近时刻的差值,其中D
t
为差分向量;当差分向量为1的时刻判定为说话开始的时刻,当差分向量为

1的时刻判定为说话结束的时刻。
[0019]说话开始时刻对应的语音小段信号提取出来的特征为清晰度特征,说话结束时刻对应的语音小段信号提取出来的特征为延音特征。
[0020]所述语音特征提取模块对整段的语音信号进行傅里叶变换,得到整段语音信号的语谱图;将整段语谱图的频率刻度由赫兹刻度转换为梅尔刻度并取对数,得到对数梅尔谱特征。
[0021]在进行傅里叶变换时,分别使用512窗长与1024窗长以提取出不同尺度的对数梅尔谱特征。
[0022]所述局部特征建模模块对输入的最终特征在时间维度上进行连续的分组,组数为输入的最终特征的时间长度的十分之一,每一组的特征代表原始语音信号的一个局部特征。
[0023]所述的局部特征建模模块使用双向长短时记忆网络对分组后的最终特征进行学习,将双向长短时记忆网络最后一个时刻的输出作为每一组特征的局部特征向量输出。
[0024]本专利技术所述一种早期阿尔茨海默症识别装置,包括拾音器和主控单元;
[0025]所述拾音器用于获取语音信号并发送至所述主控单元;
[0026]所述主控单元配置有所述的早期阿尔茨海默症识别系统。
[0027]本专利技术所述一种早期阿尔茨海默症识别系统及装置,其优点在于,针对阿尔茨海默症识别任务进行特征的优化,提出使用清晰度特征与延音特征,充分挖掘出语音信号中的有效信息。使用深度学习模型,先对输入语音信号进行局部建模,降低整体系统的参数量与计算量,提高识别速度。采用稀疏的全局建模方式,突出整段语音中的关键部分,提高识别准确率。仅需要采集说话人的日常说话信号,即可快速完成对阿尔茨海默症的识别,尤其适合社区活动中基层人员的普查摸底工作。
附图说明
[0028]图1是本专利技术所述一种早期阿尔茨海默症识别系统的结构示意图;
[0029]图2为本专利技术所述局部特征建模模块的结构示意图;
[0030]图3为本专利技术所述全局关系建模模块的结构示意图。
具体实施方式
[0031]如图1

3所示,本专利技术所述一种早期阿尔茨海默症识别系统包括语音信号采集模块、语音特征提取模块、局部特征建模模块、全局关系建模模块、识别模块。
[0032]所述语音信号采集模块用于控制拾音器捕获接收语音信号。所述语音特征提取模块将接收到的语音信号转换为多种针对阿尔茨海默症识别的语音特征。所述局部特征建模模块用于对语音特征的局部关系进行建模,得到多个局部特征向量,降低了模型的参数量与计算量。所述全局关系建模模块将所有的局部特征向量进行全局关系的建模,得到语音信号的全局特征向量。所述识别模块通过语音信号的全局特征向量识别当前语音信号是否来自阿尔兹海默症患者。
[0033]所述语音特征提取模块通过自相关函数法提取出语音信号在每一个时刻的基频信息,其数学表达形式:
[0034]计算每一帧的自相关函数,计算公式:
[0035][0036]其中,x代表一帧语音信号,N是每一帧语音信号包含的点数。
[0037]通过自相关函数中的第一峰值位置来估算该帧语音信号的基频,计算公式:
[0038][0039]其中,RF1是自相关函数中第一共振峰的位置,P是该时刻帧语音信号的基频。
[0040]将基频由0转至大于0的时刻定义为说话开始的时刻,将基频由大于0转至0的时刻定义为说话结束的时刻,其数学表达形式:
[0041]先将所有基频大于0的时刻设置为1,基频等于0的时刻设置为0,计算公式:
[0042][0043]其中,P...

【技术保护点】

【技术特征摘要】
1.一种早期阿尔茨海默症识别系统,包括依次信号连接的语音信号采集模块、语音特征提取模块、局部特征建模模块、全局关系建模模块和识别模块;其特征在于,所述的语音特征提取模块在接收语音信号后进行以下操作:提取语音信号每一时刻的基频信息,确定语音信号中说话开始的时刻和结束的时刻;对每一说话开始的时刻和结束的时刻均取其前后各一时长的语音信号生产一个对应的语音小段信号Seg,获取每个语音小段信号Seg的语谱图;使用N个临界频带滤波器对所述语谱图进行滤波得到对应的N个临界频带子带能量特征;提取语音小段信号Seg的12维的梅尔频率倒谱系数、12维的一阶差分特征以及12维的二阶差分特征;将临界频带子带能量特征、梅尔频率倒谱系数、一阶差分特征以及二阶差分特征进行拼接,得到每一个语音小段信号的最终特征;所述的局部特征建模模块接收所述最终特征并进行局部特征向量提取;所述的全局关系建模模块接收局部特征向量并进行整段语音信号的特征向量提取;所述的识别模块接收整段语音信号的特征向量进行识别,输出识别结果;所述识别结果为所述语音信号是否与早期阿尔茨海默症的语音特性相匹配。2.根据权利要求1所述一种早期阿尔茨海默症识别系统,其特征在于,确定语音信号中说话开始的时刻和结束的时刻的具体操作为:根据基频信息,利用公式获取语音信号的标记向量;其中P
t
为语音信号t时刻的基频,为语音信号的标记向量,t为输入语音信号的时间长度下标;根据标记向量,利用公式计算临近时刻的差值,其中D
t
为差分向量;...

【专利技术属性】
技术研发人员:陈炜东郭锴凌邢晓洁
申请(专利权)人:广东博微智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1