基于多任务自监督学习的医疗数据疾病识别模型构建方法技术

技术编号:41874427 阅读:19 留言:0更新日期:2024-07-02 00:26
本发明专利技术公开了一种基于多任务自监督学习的医疗数据疾病识别模型构建方法,属于检验医学和疾病识别技术领域,包括:S1、提取目标人群的医疗数据,组成原始样本数据集;S2、对原始样本数据集进行预处理;S3、利用预处理后的缺失值填补数据集、样本数据同源分析数据集构建缺失值填补模型和样本数据同源测试模型;S4、利用多任务自监督学习模型,将缺失值填补和样本数据同源预测作为辅助任务,将已知疾病筛查作为下游任务,通过迁移学习实现对原始样本数据的疾病风险评估。本发明专利技术采用上述的一种基于多任务自监督学习的医疗数据疾病识别模型构建方法,能够提取更全面和准确的特征,以达到提高下游任务泛化性能的目的。

【技术实现步骤摘要】

本专利技术涉及检验医学和疾病识别,尤其是涉及一种基于多任务自监督学习的医疗数据疾病识别模型构建方法


技术介绍

1、基于医疗数据构建疾病识别模型通常只利用有标签的数据进行监督学习,或者只依赖于单一的自监督辅助任务。然而,这些方法未能充分挖掘无标签数据中的丰富信息,也未能有效地协调多任务之间的差异和协同。例如,有标签数据可能存在数量不足或质量不佳等问题,导致训练出的模型泛化性能较差,而且标注数据会增加成本。单一的辅助任务可能无法覆盖血常规检查结果中的所有特征和关系,并且可能与下游目标任务不一致或无关,从而降低模型的有效性。此外,现有的深度学习模型可能也缺乏对医疗数据中的不确定性、异常值、噪声等因素的处理能力,导致模型在面对复杂和变化的实际情况时表现不稳定和不可靠。

2、因此,现有技术所面临的问题是如何巧妙地利用无标签或低标签数据,提高深度学习模型在医疗数据识别疾病中的泛化性能和鲁棒性。这不仅需要融合多源信息以更全面地表征血常规特征,同时构建智能的多任务自监督学习框架,以协同学习不同任务,达到提升模型性能的目标。


>

技术实本文档来自技高网...

【技术保护点】

1.一种基于多任务自监督学习的医疗数据疾病识别模型构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于多任务自监督学习的医疗数据疾病识别模型构建方法,其特征在于,步骤S1中,缺失值填补数据集是从医院或机构收集目标人群医疗数据,对目标人群医疗数据进行随机遮挡从而形成具有缺失值的数据集;

3.根据权利要求1所述的一种基于多任务自监督学习的医疗数据疾病识别模型构建方法,其特征在于,步骤S3中,缺失值填补模型的构建是采用基于全连接神经网络的回归模型,将具有缺失值的数据作为输入,完整数据集作为输出;其具体操作为:

4.根据权利要求1所述的一种基...

【技术特征摘要】

1.一种基于多任务自监督学习的医疗数据疾病识别模型构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于多任务自监督学习的医疗数据疾病识别模型构建方法,其特征在于,步骤s1中,缺失值填补数据集是从医院或机构收集目标人群医疗数据,对目标人群医疗数据进行随机遮挡从而形成具有缺失值的数据集;

3.根据权利要求1所述的一种基于多任务...

【专利技术属性】
技术研发人员:陈超宋彪王亚楠
申请(专利权)人:内蒙古卫数数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1