一种基于表格学习的医疗缺失数据插补方法技术

技术编号：39142569 阅读：13 留言：0更新日期：2023-10-23 14:55

本发明专利技术属于医疗数据处理技术领域，具体涉及一种基于表格学习的医疗缺失数据插补方法；该方法包括：获取待插补的医疗缺失数据并对其进行预处理，得到预处理好的医疗缺失数据；对预处理好的医疗缺失数据分别进行预插补和转换操作，得到初步完整医疗数据和缺失掩码矩阵；采用改进的生成器对初步完整医疗数据和缺失掩码矩阵进行处理，得到修正后的完整医疗数据；将缺失掩码矩阵输入到提示生成器中，得到提示矩阵；采用改进的鉴别器对修正医疗数据和提示矩阵进行处理，得到估计掩码矩阵；计算模型损失并根据模型损失调整模型参数，得到训练好的医疗缺失数据插补模型；本发明专利技术插补精度高，插补速度快。插补速度快。插补速度快。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于表格学习的医疗缺失数据插补方法

[0001]本专利技术属于医疗数据处理
，具体涉及一种基于表格学习的医疗缺失数据插补方法。

技术介绍

[0002]近年来随着计算机技术的兴起，各行各业都取得了飞速的发展，尤其是医疗领域。但是在医疗领域中，要分析数据必然会遇到缺失数据的问题。这个问题是不可避免的，并且在医学或者社会研究中无处不在。缺失数据往往会使得数据分析和数据挖掘复杂化并且影响随机试验和观察性研究。因此处理缺失数据已经成为了领域数据分析的重要环节。
[0003]在现有的研究中，缺失值可以分为三类：完全随机缺失、随机缺失和非随机缺失。在完全随机缺失中，缺失值不与任何变量有关，换言之就是不与其他缺失值和现有的不缺失值相关，缺失值的出现完全是随机事件。这样的数据可以看成是完整数据的随机样本。随机缺失意味着缺失值不是完全随机的，它仅仅依赖于现有的不缺失值。最后在非随机缺失中，数据的缺失不是随机的，它依赖于其他的缺失值和现有的不缺失值，并且无法通过已有的数据来掌握数据的情况。
[0004]本专利技术中的模型和数据是针对完全随机缺失情况而言，在现有的研究中，很少有表格学习结合缺失值插补方法的研究。并且由于表格数据的特殊性，深度学习在表格数据上容易造成过拟合效果，但是深度学习和表示学习近年也展现出强大的优势。

技术实现思路

[0005]针对现有技术存在的不足，本专利技术提出了一种基于表格学习的医疗缺失数据插补方法，该方法包括：获取待插补的医疗缺失数据并对其进行预处理，将预处理好的医疗缺失...

【技术保护点】

【技术特征摘要】
1.一种基于表格学习的医疗缺失数据插补方法，其特征在于，包括：获取待插补的医疗缺失数据并对其进行预处理，将预处理好的医疗缺失数据输入到训练好的医疗缺失数据插补模型中，得到完整医疗数据；医疗缺失数据插补模型的训练过程包括：S1：获取待插补的医疗缺失数据并对其进行预处理，得到预处理好的医疗缺失数据；S2：对预处理好的医疗缺失数据分别进行预插补和转换操作，得到初步完整医疗数据和缺失掩码矩阵；S3：采用改进的生成器对初步完整医疗数据和缺失掩码矩阵进行处理，得到修正医疗数据；计算生成器损失；S4：将缺失掩码矩阵输入到提示生成器中，得到提示矩阵；S5：采用改进的鉴别器对修正医疗数据和提示矩阵进行处理，得到估计掩码矩阵；S6：根据缺失掩码矩阵和估计掩码矩阵计算鉴别器损失，根据生成器损失和鉴别器损失调整模型参数，得到训练好的医疗缺失数据插补模型。2.根据权利要求1所述的一种基于表格学习的医疗缺失数据插补方法，其特征在于，采用改进的生成器对初步完整医疗数据和缺失掩码矩阵进行处理的过程包括：连接初步完整医疗数据和缺失掩码矩阵，得到连接向量；分别采用深层网络和浅层网络对连接向量进行处理，得到深层修正数据和浅层修正数据；融合深层修正数据和浅层修正数据，得到修正医疗数据。3.根据权利要求2所述的一种基于表格学习的医疗缺失数据插补方法，其特征在于，所述深层网络由多个基础块构成，两个基础块之间采用门控残差连接；每个基础块由特征选择层、注意力层和线性层组成。4.根据权利要求3所述的一种基于表格学习的医疗缺失数据插补方法，其特征在于，特征选择层对数据的处理过程包括：采用第一线性层和tanh激活函数对输入数据进行处理，得到第一输出；采用...

【专利技术属性】
技术研发人员：胡峰，周西川，于洪，苏祖强，刘运胜，代劲，刘净枫，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人