基于迁移学习的慢性阻塞性肺疾病预测系统、设备及介质技术方案

技术编号:24425746 阅读:21 留言:0更新日期:2020-06-10 09:19
本发明专利技术公开了基于迁移学习的慢性阻塞性肺疾病预测系统、设备及介质,包括:获取模块,获取慢性阻塞性肺疾病数据和待预测的疾病数据,对慢性阻塞性肺疾病和待预测疾病数据均进行预处理;提取模块,从预处理后的待预测疾病数据中提取待预测疾病的若干个特征;从预处理后的慢性阻塞性肺疾病数据中提取慢性阻塞性肺疾病数据的若干个特征;相似度计算模块,计算待预测疾病的所有特征与慢性阻塞性肺疾病数据的所有特征之间的相似度,对待预测疾病的特征赋予权重;预测模块,将赋予权重后的待预测疾病的特征进行加权融合;将融合后的待预测疾病的特征输入到预训练的基于迁移学习的弹性网络中,输出待预测疾病是否会发展为慢性阻塞性肺疾病。

Chronic obstructive pulmonary disease prediction system, equipment and media based on Transfer Learning

【技术实现步骤摘要】
基于迁移学习的慢性阻塞性肺疾病预测系统、设备及介质
本公开涉及医疗数据挖掘
,特别是涉及基于迁移学习的慢性阻塞性肺疾病预测系统、设备及介质。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
,并不必然构成现有技术。慢性阻塞性肺疾病(COPD)是一种常见的慢性呼吸道疾病,以持续性呼吸道症状和不完全可逆的气流受限为特点。慢阻肺气流受限呈进行性加重,并伴有对有害颗粒或气体,主要是吸烟所致的肺部异常炎症反应。在过去十年中,COPD的发病率逐年提升且死亡率高,成为仅次于高血压、糖尿病的中国第三大常见慢性病。在中国,40岁以上人群COPD患病率为9.9%,但由于诊断标准的差异与疾病认识的不足,其漏诊率高达70%,导致现有数据低估了慢阻肺的发病率与死亡率。因此,具有良好临床可靠性的预测数据挖掘模型是未来慢性阻塞肺疾病医疗和自我管理发展的重要目标。在实现本公开的过程中,专利技术人发现现有技术中存在以下技术问题:目前,基于数据挖掘和迁移学习相关理论,探索用于实现对慢性阻塞性肺疾病的诊断,利用疾病共有特征使用迁移学习对疾病的诊断系统尚未出现。目前针对慢性阻塞性肺疾病预测系统的诊断精度不高。
技术实现思路
为了解决现有技术的不足,本公开提供了基于迁移学习的慢性阻塞性肺疾病预测系统、设备及介质;第一方面,本公开提供了基于迁移学习的慢性阻塞性肺疾病预测系统;基于迁移学习的慢性阻塞性肺疾病预测系统,包括:获取模块,其被配置为:获取慢性阻塞性肺疾病数据和待预测的A疾病数据,对慢性阻塞性肺疾病和待预测A疾病数据均进行预处理;提取模块,其被配置为:从预处理后的待预测疾病数据中提取待预测A疾病的若干个特征;从预处理后的慢性阻塞性肺疾病数据中提取慢性阻塞性肺疾病数据的若干个特征;相似度计算模块,其被配置为:计算待预测A疾病的所有特征与慢性阻塞性肺疾病数据的所有特征之间的相似度,对相似度高的待预测A疾病的特征赋予高权重,对相似度低的待预测A疾病的特征赋予低权重;预测模块,其被配置为:将赋予权重后的待预测A疾病的特征进行加权融合,得到融合后的待预测A疾病的特征;将融合后的待预测A疾病的特征输入到预训练的基于迁移学习的弹性网络中,输出待预测A疾病是否会发展为慢性阻塞性肺疾病。第二方面,本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述系统中各个模块的功能。第三方面,本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述系统中各个模块的功能。与现有技术相比,本公开的有益效果是:使用弹性网络获得对疾病固有特征成分的认识,并完成对疾病的诊断;通过特征提取获得COPD数据集的最优特征子集;构造预训练的基于迁移学习的弹性网络,并使用弹性网络和迁移学习相融合的参数初始化策略对迁移学习模型进行优化,并对迁移学习模型进行测试,且该模型具有网络结构简单、高效的特点,能够利用该网络实现待预测A疾病是否会发展为慢性阻塞性肺疾病的预测结果,是辅助医生进行诊断治疗的系统。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为本公开实施例一的方法流程图;图2为本公开实施例一的F1对比图;图3为本公开实施例一ROC对比图;图4为本公开实施例一疾病分类图。具体实施方式应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。实施例一,本实施例提供了基于迁移学习的慢性阻塞性肺疾病预测系统;如图1所示,基于迁移学习的慢性阻塞性肺疾病预测系统,包括:获取模块,其被配置为:获取慢性阻塞性肺疾病数据和待预测的A疾病数据,对慢性阻塞性肺疾病和待预测A疾病数据均进行预处理;提取模块,其被配置为:从预处理后的待预测疾病数据中提取待预测A疾病的若干个特征;从预处理后的慢性阻塞性肺疾病数据中提取慢性阻塞性肺疾病数据的若干个特征;相似度计算模块,其被配置为:计算待预测A疾病的所有特征与慢性阻塞性肺疾病数据的所有特征之间的相似度,对相似度高的待预测A疾病的特征赋予高权重,对相似度低的待预测A疾病的特征赋予低权重;预测模块,其被配置为:将赋予权重后的待预测A疾病的特征进行加权融合,得到融合后的待预测A疾病的特征;将融合后的待预测A疾病的特征输入到预训练的基于迁移学习的弹性网络中,输出待预测A疾病是否会发展为慢性阻塞性肺疾病。进一步地,所述待预测A疾病数据,包括:支气管炎、肺气肿或哮喘疾病数据中的一种或多种。A只是一个符号,指代慢性阻塞性肺疾病的先期疾病中的一种或多种。进一步地,所述对慢性阻塞性肺疾病和待预测A疾病数据均进行预处理;具体包括:数据转换单元,用于将文字数据转换为数字数据;数据筛选单元,用于将噪声数据剔除,噪声数据是指与待预测A疾病数据不相关的数据;噪声数据,例如在支气管炎数据集中含有的骨折数据。数据填充单元,用于对缺失数据进行填充;数据归一化单元,用于对数据进行归一化处理。进一步地,所述数据归一化单元,其被配置为:采用被测者肺部机能检测项目测量值的最大值和最小值对格式转换后的被测者肺部机能检测项目测量值进行归一化处理,提高计算精度。进一步地,所述从预处理后的待预测A疾病数据中提取待预测疾病的若干个特征;提取的待预测A疾病的若干个特征具体是指:进一步地,所述从预处理后的待预测A疾病数据中提取待预测疾病的若干个特征,如气促、咳嗽、咳痰、呼吸困难、反复呼吸道感染等、呼吸急促等;采用过滤式特征选择算法来进行特征提取。进一步地,采用过滤式特征选择算法来进行特征提取,包括:对特征进行相关性分析,对相似度高的任意两个特征随机选择一种保留,删除另外一种;对特征进行冗余性分析,提取出与A疾病相关性高于设定阈值的特征,以马尔科夫毯算法删除冗余特征。进一步地,对特征进行相关性分析,具体步骤包括:对每一个特征fi,计算其对称不确定性,计算公式为:其中,MI(C|fi)max表示标签C与特征fi之间的最大互信息,公式为:E(c)和E(fi)分别标签C与特征fi的信息熵。给定一个阈值η,若SU(fi|C本文档来自技高网
...

【技术保护点】
1.基于迁移学习的慢性阻塞性肺疾病预测系统,其特征是,包括:/n获取模块,其被配置为:获取慢性阻塞性肺疾病数据和待预测的A疾病数据,对慢性阻塞性肺疾病和待预测A疾病数据均进行预处理;/n提取模块,其被配置为:从预处理后的待预测疾病数据中提取待预测A疾病的若干个特征;从预处理后的慢性阻塞性肺疾病数据中提取慢性阻塞性肺疾病数据的若干个特征;/n相似度计算模块,其被配置为:计算待预测A疾病的所有特征与慢性阻塞性肺疾病数据的所有特征之间的相似度,对相似度高的待预测A疾病的特征赋予高权重,对相似度低的待预测A疾病的特征赋予低权重;/n预测模块,其被配置为:将赋予权重后的待预测A疾病的特征进行加权融合,得到融合后的待预测A疾病的特征;将融合后的待预测A疾病的特征输入到预训练的基于迁移学习的弹性网络中,输出待预测A疾病是否会发展为慢性阻塞性肺疾病。/n

【技术特征摘要】
1.基于迁移学习的慢性阻塞性肺疾病预测系统,其特征是,包括:
获取模块,其被配置为:获取慢性阻塞性肺疾病数据和待预测的A疾病数据,对慢性阻塞性肺疾病和待预测A疾病数据均进行预处理;
提取模块,其被配置为:从预处理后的待预测疾病数据中提取待预测A疾病的若干个特征;从预处理后的慢性阻塞性肺疾病数据中提取慢性阻塞性肺疾病数据的若干个特征;
相似度计算模块,其被配置为:计算待预测A疾病的所有特征与慢性阻塞性肺疾病数据的所有特征之间的相似度,对相似度高的待预测A疾病的特征赋予高权重,对相似度低的待预测A疾病的特征赋予低权重;
预测模块,其被配置为:将赋予权重后的待预测A疾病的特征进行加权融合,得到融合后的待预测A疾病的特征;将融合后的待预测A疾病的特征输入到预训练的基于迁移学习的弹性网络中,输出待预测A疾病是否会发展为慢性阻塞性肺疾病。


2.如权利要求1所述的系统,其特征是,所述待预测A疾病数据,包括:支气管炎、肺气肿或哮喘疾病数据中的一种或多种。


3.如权利要求1所述的系统,其特征是,所述对慢性阻塞性肺疾病和待预测A疾病数据均进行预处理;具体包括:
数据转换单元,用于将文字数据转换为数字数据;
数据筛选单元,用于将噪声数据剔除;
数据填充单元,用于对缺失数据进行填充;
数据归一化单元,用于对数据进行归一化处理。


4.如权利要求1所述的系统,其特征是,所述从预处理后的待预测A疾病数据中提取待预测疾病的若干个特征;采用过滤式特征选择算法来进行特征提取。


5.如权利要求4所述的系统,其特征是,采用过滤式特征选择算法来进行特征提取,包括:
对特征进行相关性分析,对相似度高的任意两个特征随机选择一种保留,删除另外一种;
对特征进行冗余性分析,提取出与A疾病相关性高于设定阈值的特征,以马尔科夫毯算法删除冗余特征。


6.如权利要求4所述的系统,其特征是,所述计算待预测A疾病的所有特征与慢性阻塞性肺疾病数据的所有特征之间的相似度,其中相似度是指欧式距离或余弦距离。


7.如权利要求4所述的系统,其特...

【专利技术属性】
技术研发人员:王红虞凤萍赵丽丽王倩王彩雨韩书李威庄鲁贺张慧
申请(专利权)人:山东师范大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1