当前位置: 首页 > 专利查询>复旦大学专利>正文

基于日间语音OSA严重程度判别识别模型的构建方法技术

技术编号:37564533 阅读:18 留言:0更新日期:2023-05-15 07:45
本发明专利技术公开了一种基于日间语音OSA严重程度判别识别模型的构建方法。该方法包括以下步骤:采集受试者的语音信号;对语音信号依次进行预处理、特征提取、特征选择和特征拼接;构建均衡数据集;构建机器学习模型作为基分类器,对模型进行评价,从其中选择若干准确率较高的模型;采用Voting融合算法集成模型,取多个基分类器预测样本为某一类别的概率的均值,最高概率所对应的类别即为预测结果,强化模型的分类能力与泛化能力。本发明专利技术的模型用于识别判别阻塞性睡眠呼吸暂停综合征,无创、更快、成本更低、准确度高。准确度高。准确度高。

【技术实现步骤摘要】
基于日间语音OSA严重程度判别识别模型的构建方法


[0001]本专利技术涉及阻塞性睡眠呼吸暂停综合征诊断筛查
,具体的说,涉及一种基于日间语音OSA模型的构建方法。

技术介绍

[0002]阻塞性睡眠呼吸暂停综合征(Obstructive Sleep Apnea Syndrome,OSAS)是一种最常见的睡眠障碍,该疾病的特征是睡眠期间上呼吸道反复塌陷,引起睡眠呼吸暂停和通气不足,伴有打鼾、反复觉醒、间歇性低血氧症、睡眠结构紊乱,从而导致睡眠质量差。研究表明,全球30

69岁的成年人中有9.36亿患有轻度至重度OSA,有4.25亿患有中度至重度OSA,受影响人数在中国最高,然而大多数受影响的人仍未得到及时的诊断和治疗。越来越多的研究表明,OSA的慢性和急性疾病的危险因素高于常人,可能会引起心血管疾病、日间过度嗜睡、精神异常、重大交通事故和死亡率增加等等,并已被证明会增加夜间心源性猝死的风险。目前,OSA诊断的金标准是通过使用多导睡眠图(Polysomnography,PSG)观察睡眠期间每小时呼吸暂停和低通气事件的平均数量计算呼吸暂停低通气指数(Apnea

Hypopnea Index,AHI)来诊断OSA。
[0003]然而,PSG需要很长的预约和检查时间,PSG的结果需由专业的持证人员分析,在PSG过程中患者全身需要连接繁琐的传感器,这可能会影响到患者的睡眠结构,且电极的接触不良可能会使整晚的PSG记录无效。由于上述种种原因,普通人群中OSA的诊断率相对较低。目前,OSA的初步筛查评估是通过患者的病史、体格检查、询问睡眠时是否打鼾、通过ESS问卷、Berlin问卷、STOP

Bang问卷等预测OSA的风险水平,虽然问卷是一种实用、低成本且效率高的方法,但在准确识别方面受个人影响即患者自身可能存在自我选择偏见,此外很多研究表明问卷存在特异度较低的缺陷,且问卷被证明无法检测到心血管疾病患者的睡眠呼吸紊乱。
[0004]语音信号包含大量人体特征信息,包括情绪、声纹、韵律等等,有非侵入性、客观性、便捷性的特点,因此具有较高的应用价值。声道作为上气道的一部分,主要结构包括声带,咽腔,喉腔,口腔,鼻腔,软腭,硬腭,舌牙齿及口唇,OSA患者由于长期的上呼吸道解剖结构塌陷,表现为软腭松弛、咽腔狭窄、咽部肿瘤、舌根变大、软组织结构增大,也有研究表明OSA患者下颌、上颌、颅底、舌骨和头部位置特征,以及上气道和周围软组织的大小与正常人相比均存在异常,而语音信号的发出需要声道中的各器官的协同作用,声道的任何解剖和功能变化可能会影响语音的声学特征,亦有可能直接影响个体语音的语速,音调,响度,音质等。
[0005]由于OSA的高发病率低诊断率、疾病风险因素高,而诊断OSA的金标准PSG的金钱及时间成本过高,临床上常用的问卷初步筛查也存在自我选择偏见、特异度较低等不可忽视的缺陷,如何快速且可靠的筛查OSA高危患者是睡眠医学的研究热点之一,临床上迫切需要一种新型的OSA诊断筛查工具,我们期望这类新型的OSA诊断筛查工具是经济、高效、可靠且是无接触式的。睡眠医生可以通过这类工具快速、可靠地识别有严重OSA风险的患者,并优
先对患者进行PSG睡眠测试,早期的识别和治疗OSA以预防很多不良的健康问题。

技术实现思路

[0006]针对OSA的高发病率低诊断率、疾病风险因素高,而诊断OSA的金标准PSG的金钱及时间成本过高,临床上常用的问卷初步筛查也存在自我选择偏见、特异度较低等不可忽视的缺陷,本专利技术旨在提供一种基于日间语音OSA严重程度判别识别模型的构建方法;本专利技术通过分析语音信号的特征,并结合机器学习的方法对阻塞性睡眠呼吸暂停综合征识别及严重程度判别分级,可以为阻塞性睡眠呼吸暂停综合征提供一种无创、更快、成本更低的诊断工具;本专利技术能解决临床上OSA高发病低诊断率、PSG成本过高、问卷筛查的缺陷等问题。
[0007]本专利技术的技术方案具体介绍如下。
[0008]一种基于日间语音的全自动阻塞性睡眠呼吸暂停综合征识别及严重程度判别模型的构建方法,包括以下步骤:
[0009](1)采集受试者的语音信号,语音信号包括元音及设计的词语、句子;
[0010](2)获取受试者行整夜PSG后得出的AHI指数,对受试者进行严重程度分级;
[0011](3)对所述语音信号进行预处理、特征提取以及特征选择,提取丰富的多维度语音特征,并对其采用特征选择方法,保留贡献值最高的前20个特征并拼接成一维向量作为语音特征,为后续的训练提供最具检测效能的特征集;
[0012](4)对样本采用数据均衡算法,构建均衡数据集,改善数据类间不平衡的问题;
[0013](5)构建机器学习模型作为基分类器,对模型进行评价;
[0014](6)模型集成
[0015]采用Voting融合算法集成模型,取多个基分类器预测样本为某一类别的概率的均值,最高概率所对应的类别即为预测结果,强化模型的分类能力与泛化能力。
[0016]本专利技术中,步骤(2)中,按照以下标准对受试者进行严重程度分级:
[0017]任务一:二分类,无OSA和有OSA;
[0018]无OSA,AHI<5次/小时;有OSA,AHI≥5次/小时;
[0019]任务二:四分类,无OSA、轻度OSA、中度OSA和重度OSA;
[0020]无OSA,AHI<5次/小时;轻度OSA,5次/小时≤AHI<15次/小时;中度OSA,15次/小时≤AHI<30次/小时;重度OSA,AHI≥30次/小时。
[0021]本专利技术中,步骤(3)中,提取的特征包括能量特征、时域特征、频域特征及乐理特征;特征选择方法采用单变量选择法。
[0022]本专利技术中,步骤(4)中,数据均衡算法包括SMOTE算法。
[0023]本专利技术中,步骤(5)中,机器学习模型包括K近邻模型、支持向量机模型和AdaBoost模型。
[0024]本专利技术中,步骤(4)和步骤(5)中,采用Easy Ensemble模型构建均衡数据集和基分类器。
[0025]本专利技术中,步骤(5)中,通过准确率、精确率、召回率及F1分数作为模型评价指标。
[0026]本专利技术中,步骤(6)中,Voting融合算法为softVoting融合算法。
[0027]综上,相比于与现有的OSA诊断技术,本专利技术具有显著的实质性优点:
[0028]1.针对病理性语音模式可能存在的特征(尤其是OSA患者的特征),设计与之对应
的语音范式,且采集的语音信号类型更丰富,涵盖元音、词语及句子;
[0029]2.本专利技术将语音信号用于机器学习,开发了一个全自动基于日间语音OSA严重程度判别模型,医生可以通过本专利技术构建的判别模型快速、可靠地识别有严重OSA风险的患者,并优先对严重患者进行PSG睡眠测试,早期的识别和治疗OSA以预防诸本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于日间语音的全自动阻塞性睡眠呼吸暂停综合征识别及严重程度判别模型的构建方法,其特征在于,所述模型用于全自动阻塞性睡眠呼吸暂停综合征识别及严重程度判别;包括以下步骤:(1)采集受试者的语音信号,语音信号包括元音及设计的词语、句子;(2)获取受试者整夜PSG后得出的AHI指数,对受试者进行严重程度分级:(3)对所述语音信号进行预处理、特征提取、特征选择和特征拼接,提取丰富的多维度语音特征,并对其采用特征选择方法,保留贡献值最高的前20个特征并拼接成一维向量作为语音特征,为后续的训练提供最具检测效能的特征集;(4)对样本采用数据均衡算法,构建均衡数据集,改善数据类间不平衡的问题;(5)将构建若干机器学习模型作为基分类器,对模型进行评价;(6)模型集成采用Voting融合算法集成模型,取多个基分类器预测样本为某一类别的概率的均值,最高概率所对应的类别即为预测结果,强化模型的分类能力与泛化能力。2.根据权利要求1所述的构建方法,其特征在于,步骤(2)中,按照以下两种标准对受试者进行严重程度分级:任务一二分类:无OSA和有OSA;无OSA, AHI<5次/小时;有OSA, AHI≥...

【专利技术属性】
技术研发人员:胡霞陈炜陈晨周涛张佳辰罗竞春
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1