基于多任务自监督学习的医疗数据疾病识别模型构建方法技术

技术编号：41874427 阅读：19 留言：0更新日期：2024-07-02 00:26

本发明专利技术公开了一种基于多任务自监督学习的医疗数据疾病识别模型构建方法，属于检验医学和疾病识别技术领域，包括：S1、提取目标人群的医疗数据，组成原始样本数据集；S2、对原始样本数据集进行预处理；S3、利用预处理后的缺失值填补数据集、样本数据同源分析数据集构建缺失值填补模型和样本数据同源测试模型；S4、利用多任务自监督学习模型，将缺失值填补和样本数据同源预测作为辅助任务，将已知疾病筛查作为下游任务，通过迁移学习实现对原始样本数据的疾病风险评估。本发明专利技术采用上述的一种基于多任务自监督学习的医疗数据疾病识别模型构建方法，能够提取更全面和准确的特征，以达到提高下游任务泛化性能的目的。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及检验医学和疾病识别，尤其是涉及一种基于多任务自监督学习的医疗数据疾病识别模型构建方法。

技术介绍

1、基于医疗数据构建疾病识别模型通常只利用有标签的数据进行监督学习，或者只依赖于单一的自监督辅助任务。然而，这些方法未能充分挖掘无标签数据中的丰富信息，也未能有效地协调多任务之间的差异和协同。例如，有标签数据可能存在数量不足或质量不佳等问题，导致训练出的模型泛化性能较差，而且标注数据会增加成本。单一的辅助任务可能无法覆盖血常规检查结果中的所有特征和关系，并且可能与下游目标任务不一致或无关，从而降低模型的有效性。此外，现有的深度学习模型可能也缺乏对医疗数据中的不确定性、异常值、噪声等因素的处理能力，导致模型在面对复杂和变化的实际情况时表现不稳定和不可靠。

2、因此，现有技术所面临的问题是如何巧妙地利用无标签或低标签数据，提高深度学习模型在医疗数据识别疾病中的泛化性能和鲁棒性。这不仅需要融合多源信息以更全面地表征血常规特征，同时构建智能的多任务自监督学习框架，以协同学习不同任务，达到提升模型性能的目标。

技术实本文档来自技高网...

【技术保护点】

1.一种基于多任务自监督学习的医疗数据疾病识别模型构建方法，其特征在于，包括以下步骤：
2.根据权利要求1所述的一种基于多任务自监督学习的医疗数据疾病识别模型构建方法，其特征在于，步骤S1中，缺失值填补数据集是从医院或机构收集目标人群医疗数据，对目标人群医疗数据进行随机遮挡从而形成具有缺失值的数据集；
3.根据权利要求1所述的一种基于多任务自监督学习的医疗数据疾病识别模型构建方法，其特征在于，步骤S3中，缺失值填补模型的构建是采用基于全连接神经网络的回归模型，将具有缺失值的数据作为输入，完整数据集作为输出；其具体操作为：
4.根据权利要求1所述的一种基...

【技术特征摘要】

1.一种基于多任务自监督学习的医疗数据疾病识别模型构建方法，其特征在于，包括以下步骤：
2.根据权利要求1所述的一种基于多任务自监督学习的医疗数据疾病识别模型构建方法，其特征在于，步骤s1中，缺失值填补数据集是从医院或机构收集目标人群医疗数据，对目标人群医疗数据进行随机遮挡从而形成具有缺失值的数据集；
3.根据权利要求1所述的一种基于多任务...

【专利技术属性】
技术研发人员：陈超，宋彪，王亚楠，
申请(专利权)人：内蒙古卫数数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

上一篇：一种具有位移监测功能的汽轮机摆架装置制造方法及图纸
下一篇：一种乙醇汽油生产装置及其使用方法制造方法及图纸

相关技术

基于常规检验数据的人体营养元素缺乏风...

一种基于常规检验数据的中医体质智能辨...

一种基于TPS的科技成果多维动态评价...

一种血常规结果审核与同源匹配方法及系...

一种多病种模型解释结果的关联分析方法...

一种基于多维度检验数据的疾病早筛模型...

一种智能分析血常规检验数据在血流变预...

基于血常规的协同训练共享多模型在肺结...

一种基于主诉和血常规数据的分类模型构...

一种基于血常规生化数据抑郁症程度区分...

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术

基于Boruta特征筛选融合模糊层次...

一种选择多价肿瘤新抗原组合系统和方法...

一种尿动力学评估报告生成系统及方法技...

一种抑郁症数据智能检测方法、系统、介...

确定用药类型的方法和系统技术方案

康复机器人联合任务态神经调控的方法、...

一种用于代谢物发现的搜索方法技术

IgA肾病新月体病变的非侵入性临床预...