一种基于异构联合模型的疾病筛查方法技术

技术编号:39273006 阅读:7 留言:0更新日期:2023-11-07 10:51
本发明专利技术公开了一种基于异构联合模型的疾病筛查方法,属于人工智能的疾病筛查技术领域。基于异构联合模型的疾病筛查方法包括以下步骤:S1、主模型训练数据抽取,将数据处理成结构化二维表或矩阵,去除缺失数据,统一维度单位量纲;S2、主模型初始模型训练,基于结构化数据进行特征工程处理,特征工程后的数据利用神经网络训练分类任务;S3、主模型初始模型效能分析,确定负面干预性疾病;S4、针对负面干预性疾病,构建异构辅助模型,并对异构辅助模型进行训练;S5、主模型训练数据增维;S6、主模型训练。本发明专利技术采用上述基于异构联合模型的疾病筛查方法,利用新的架构方案减弱数据质量所带来的影响,对实际场景下的模型效能有了实质型提升。升。升。

【技术实现步骤摘要】
一种基于异构联合模型的疾病筛查方法


[0001]本专利技术涉及人工智能的疾病筛查
,尤其是涉及一种基于异构联合模型的疾病筛查方法。

技术介绍

[0002]布鲁氏菌病(以下简称布病)是由布鲁氏菌引起的一种人兽共患传染病之一,家畜中猪、羊、牛对其最易感,可引起母畜传染性流产。人类主要通过接触带菌动物或食用病畜及其相关乳制品而造成感染。布病为我国法定二类疫病。我国是畜牧业大国,主要分布在内蒙古自治区、西藏自治区、青海省等北方地区,多以牛羊为主。随着畜牧业的迅速发展,我国牲畜饲养量逐渐增加,畜牧产品的流通速度加快,使布病扩散速度增快,流行范围也不断扩大,成为我国重要的公共卫生问题之一。布鲁氏菌可侵害人体心血管、呼吸、泌尿生殖、神经、运动等多个系统,严重可导致患者丧失劳动能力。急性期患者的症状与上呼吸道感染等疾病类似,极易因症状不具有特异性而误诊误治进而转为慢性布病,同时无特效治疗方案,反复发作,迁延不愈,因病致贫、因病返贫的现象也时有发生。
[0003]随着硬件技术的不断发展,人工智能领域技术得以广泛应用。人工智能是研究、开发以模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一种科学技术。今人工智能技术已被广泛应用于智能医疗领域,在疾病早期筛查、医学影像识别、药物开发、智能健康管理中发挥着重要作用,可以帮助医生分析病情,改进病理分析方案,推动我国医疗事业向智能化发展。同时,专家系统也在医疗领域中发挥着重要作用,医生可以将其专业领域的东西存放在专家系统中,让系统像专家一样展开工作。这不仅节省了时间,也提高了工作效率,降低了误判的发生频率。
[0004]在疾病早期筛查领域,依托患者的大数据信息,人工智能系统可以快速、高效的挖掘患者相关疾病症状及程度,定位目标群体,简化筛查组织工作,提升筛查效率。从而使人群中大量未诊断的患者能得到早期诊断和早期治疗。筛查是对疾病无察觉的一类人群提供的公共卫生服务,这类人群已经处于患病危险或者已经被疾病影响。筛查为此类人群实施问卷调查或者提供测试,目的是确定进一步测试或者治疗,使得他们尽可能的得到帮助,从而降低疾病所带来的影响和风险。目前,基础的筛查流程已经被国内外一致认可并应用,即对于健康人群,或者是表面健康尚无症状或临床诊断的人群进行筛查试验,将试验结果阴性与阳性者区分开,对于试验阳性者进一步实施疾病的诊断。
[0005]目前机器学习在疾病预测领域应用中最显著的问题是其准确率及泛化性问题。尤其在疾病预测领域,通常机器学习依赖于临床诊断结果作为有监督学习标签,但由于临床诊断对于患者身体状况描述所存在的不全面性、不完整性、不绝对性,即临床诊断只描述了患者部分疾病特征,且疾病程度在临床诊断中非绝对性存在。例如高血压、糖尿病等中老年常见疾病,其本身很可能同时患有其他及疾病,如心脏病、关节炎等,但临床诊断只包含部分疾病结果,导致其检验数据中携带其他疾病表征,致使机器学习的检验数据疾病表征和标签存在非绝对对应关系。而机器学习模型本身需要利用结构化数据进行构建,此时我们
在抽取某疾病患者和非某疾病患者时很大程度存在标签准确性问题。导致目标疾病分类模型学习到其他疾病交融表征,加剧了模型预测的假性结果比例,导致模型综合效能下降。

技术实现思路

[0006]本专利技术的目的是提供一种基于异构联合模型的疾病筛查方法,利用新的架构方案减弱数据质量所带来的影响,对实际场景下的模型效能有了实质型提升;为疾病筛查提供了一种高精度、高泛化性的新方法框架。
[0007]为实现上述目的,本专利技术提供了一种基于异构联合模型的疾病筛查方法,包括以下步骤:
[0008]S1、主模型训练数据抽取,将数据处理成结构化二维表或矩阵,去除缺失数据,统一维度单位量纲;
[0009]S2、主模型初始模型训练,基于结构化数据进行特征工程处理,特征工程后的数据利用神经网络训练分类任务;
[0010]S3、主模型初始模型效能分析,确定负面干预性疾病;
[0011]S4、针对负面干预性疾病,构建异构辅助模型,并对异构辅助模型进行训练;
[0012]S5、主模型训练数据增维;
[0013]S6、主模型训练。
[0014]优选的,所述S1中,训练数据包括布病阳性患者首诊血常规样本和非布病患者血常规样本,数据的特征维度为血常规、年龄和性别。
[0015]优选的,所述S2中,特征工程处理具体为:
[0016]a)、对类别维度进行编码化;
[0017]b)、对各个特征维度进行正态标准化;
[0018]c)、对标准化完成后的数据按照8:2数量比例抽取训练集和测试集;
[0019]d)、利用过采样方法将训练集数据取平。
[0020]优选的,所述S2中,利用神经网络训练分类任务具体为:
[0021]初始化网络参数,并设置模型轮次验证,观察模型初次训练效果;如存在验证集准确率、敏感度、特异度指标不理想,则增加神经元数量和网络深度进行增强,对compile方法内部及fit方法内部参数进行调整测试,提升模型效能。
[0022]优选的,所述S3中,对训练完成的初始模型利用测试集进行初始模型效能分析,分析假阳结构是否存在疾病类别聚集,确定负面干预性疾病。
[0023]优选的,所述S4中,针对负面干预性疾病进行对应数据抽取,用于训练辅助模型;数据包括负面干预性疾病阳性患者首诊血常规样本,非布病患者血常规样本,数据的特征维度为血常规、年龄和性别。
[0024]优选的,所述S4中,异构辅助模型训练完成后利用混淆矩阵分别对其效能指标进行评估。
[0025]优选的,所述S5中,主模型训练数据增维具体为:
[0026]将主模型初始模型的训练集数据和测试集数据分别投入辅助模型进行预测,将辅助模型的预测概率值分别追加一个新的维度到初始模型训练数据。
[0027]优选的,所述S5中,将增维后的训练集的数据利用神经网络进行分类任务学习,主
模型训练完成后利用增维后的测试集对模型效能进行评估。
[0028]本专利技术所述的一种基于异构联合模型的疾病筛查方法的优点和积极效果是:本专利技术根据主模型初始模型的训练和效能分许,确定负面干预性疾病,并根据负面干预性疾病构件对应的异构辅助模型,利用异构辅助模型的预测概率值为主模型增维,提升模型整体效能。针对目标问题比同构模型在精度及泛化性上存在显著优势。
[0029]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
附图说明
[0030]图1为本专利技术一种基于异构联合模型的疾病筛查方法的流程图;
[0031]图2为本专利技术一种基于异构联合模型的疾病筛查方法的模型架构图。
具体实施方式
[0032]以下通过附图和实施例对本专利技术的技术方案作进一步说明。
[0033]实施例
[0034]一种基于异构联合模型的疾病筛查方法,包括以下步骤:
[0035]S1、主模型训练数据抽取,并将数据处理成结构化二维表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于异构联合模型的疾病筛查方法,其特征在于,包括以下步骤:S1、主模型训练数据抽取,将数据处理成结构化二维表或矩阵,去除缺失数据,统一维度单位量纲;S2、主模型初始模型训练,基于结构化数据进行特征工程处理,特征工程后的数据利用神经网络训练分类任务;S3、主模型初始模型效能分析,确定负面干预性疾病;S4、针对负面干预性疾病,构建异构辅助模型,并对异构辅助模型进行训练;S5、主模型训练数据增维;S6、主模型训练。2.根据权利要求1所述的一种基于异构联合模型的疾病筛查方法,其特征在于:所述S1中,训练数据包括布病阳性患者首诊血常规样本和非布病患者血常规样本,数据的特征维度为血常规、年龄和性别。3.根据权利要求2所述的一种基于异构联合模型的疾病筛查方法,其特征在于:所述S2中,特征工程处理具体为:a)、对类别维度进行编码化;b)、对各个特征维度进行正态标准化;c)、对标准化完成后的数据按照8:2数量比例抽取训练集和测试集;d)、利用过采样方法将训练集数据取平。4.根据权利要求3所述的一种基于异构联合模型的疾病筛查方法,其特征在于:所述S2中,利用神经网络训练分类任务具体为:初始化网络参数,并设置模型轮次验证,观察模型初次训练效果;如存在验证集准确率、敏感度、特异度指标不理想,则增加神经元数量...

【专利技术属性】
技术研发人员:陈超宋彪许鸿蕾
申请(专利权)人:内蒙古卫数数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1