System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于自注意机制的VAE的数据降维方法及预测装置制造方法及图纸_技高网

基于自注意机制的VAE的数据降维方法及预测装置制造方法及图纸

技术编号:41208369 阅读:2 留言:0更新日期:2024-05-09 23:30
本发明专利技术提供了一种基于自注意机制的VAE的数据降维方法及预测装置,具有这样的特征,包括以下步骤:步骤S1,构建初始变分自编码器;步骤S2,根据现有的高维生化数据构建训练集,对初始变分自编码器进行训练,得到变分自编码器;步骤S3,根据变分自编码器的编码器,构建降维模型;步骤S4,对高维生化数据进行预处理,得到预处理高维生化数据;步骤S5,将预处理高维生化数据输入降维模型,得到低维数据。总之,本方法具有较好的数据降维效果,进而能够得到准确的主动脉夹层预后预测结果。

【技术实现步骤摘要】

本专利技术涉及一种数据处理方法,具体涉及一种基于自注意机制的vae的数据降维方法及预测装置。


技术介绍

1、在医疗领域中,处理生化数据时传统方法通常依赖于特征降维技术,例如主成分分析即pca、lasso回归、单因素和多因素分析。

2、pca通过线性组合方式减少变量的数量,但这可能导致一些重要信息的损失。pca生成的主成分往往难以解释,尤其是当主成分是原始变量的复杂线性组合时。此外,由于pca假设数据的主要结构是线性的,对于非线性结构的数据,pca可能不够有效。pca也对变量的规模非常敏感,不同规模的变量可能会对结果产生巨大影响,因此在应用pca之前需要进行规范化处理。

3、在lasso回归中,正则化参数即lambda的选择对结果有很大影响,而且这个选择通常是基于经验的。通过施加罚项减少方差的同时,lasso可能会增加偏差。当存在高度相关的预测变量时,lasso可能只选择其中一个变量,忽略其他同样重要的变量。在特征数量超过样本数量的情况下,lasso选择的特征数量最多等于样本数量。

4、单因素分析则存在忽略变量间的相互作用的问题。而多因素分析通常基于线性模型,可能无法捕捉到非线性关系,当包含过多变量时,模型可能会过度拟合数据。此外,当模型变得复杂时,多因素分析的结果的解释可能会变得困难。

5、综上所述,现有的数据降维方法还存在较多的问题,不能适用于包含复杂数据的生化数据的处理。


技术实现思路

1、本专利技术是为了解决上述问题而进行的,目的在于提供一种基于自注意机制的vae的数据降维方法及预测装置。

2、本专利技术提供了一种基于自注意机制的vae的高维生化数据降维方法,用于生成高维生化数据对应的低维数据,具有这样的特征,包括以下步骤:步骤s1,构建初始变分自编码器;步骤s2,根据现有的高维生化数据构建训练集,对初始变分自编码器进行训练,得到变分自编码器;步骤s3,根据变分自编码器的编码器,构建降维模型;步骤s4,对高维生化数据进行预处理,得到预处理高维生化数据;步骤s5,将预处理高维生化数据输入降维模型,得到低维数据,其中,降维模型包括降维单元和低维数据生成单元,降维单元用于对预处理高维生化数据进行降维,得到降维数据,低维数据生成单元包括编码器,编码器包括顺次连接的多层卷积神经网络,用于根据降维数据得到低维数据,第n层卷积神经网络根据输入的隐藏层特征ln得到输出的隐藏层特征ln+1的表达式为:式中conv()为卷积操作,fc(ln)为对隐藏层特征ln经由注意力加权得到的注意力特征权重,softmax()为softmax操作,为按位加权操作,第1层卷积神经网络对应的隐藏层特征l1为降维数据,最后一层卷积神经网络输出的隐藏特征为低维数据。

3、在本专利技术提供的基于自注意机制的vae的高维生化数据降维方法中,还可以具有这样的特征:其中,在步骤s2中,对初始变分自编码器进行训练的过程中,对应的损失函数优化规则的表达式为:式中ηt为t时刻的学习率,为预设的最小值,为预设的最大值,tcur为当前迭代次数,ti为最大迭代次数。

4、在本专利技术提供的基于自注意机制的vae的高维生化数据降维方法中,还可以具有这样的特征:其中,降维模块包含全连接层,用于将预处理高维生化数据降维到1024维,得到降维数据。

5、在本专利技术提供的基于自注意机制的vae的高维生化数据降维方法中,还可以具有这样的特征:其中,编码器包括顺次连接的3层卷积神经网络,3层卷积神经网络分别包含32、64和128个输出通道,各个卷积神经网络的卷积核大小均为3×1,步长为1。

6、在本专利技术提供的基于自注意机制的vae的高维生化数据降维方法中,还可以具有这样的特征:其中,初始变分自编码器包括编码器和解码器,编码器的结构与解码器的结构呈镜像对称。

7、在本专利技术提供的基于自注意机制的vae的高维生化数据降维方法中,还可以具有这样的特征:其中,在步骤s4中,预处理包括缺失值处理和数据归一化,缺失值处理为删除高维生化数据中存在缺失值的特征,数据归一化为对高维生化数据中的所有特征进行min-max归一化。

8、在本专利技术提供的基于自注意机制的vae的高维生化数据降维方法中,还可以具有这样的特征:其中,高维生化数据包括血液数据、基因数据和蛋白数据。

9、本专利技术还提供了一种基于自注意机制的vae的主动脉夹层预后预测装置,用于根据采集的多项高维生化数据生成对应的主动脉夹层预后预测结果,具有这样的特征,包括:预处理模块,用于对各项高维生化数据分别进行预处理,得到对应的预处理高维生化数据;低维数据生成模块,包括分别对应各项高维生化数据的多个降维模型,用于根据高维生化数据得到对应的低维数据;统一向量生成模块,用于将所有低维数据进行堆叠,得到统一向量;预测生成模块,包括主动脉夹层预后预测模型,用于根据统一向量得到主动脉夹层预后预测结果,其中,每项高维生化数据对应不同的组学类型,降维模型的构建过程包括以下步骤:步骤s1,构建初始变分自编码器;步骤s2,根据现有的高维生化数据构建训练集,对初始变分自编码器进行训练,得到变分自编码器;步骤s3,根据变分自编码器的编码器,构建降维模型,降维模型包括降维单元和低维数据生成单元,降维单元用于对预处理高维生化数据进行降维,得到降维数据,低维数据生成单元包括编码器,编码器包括顺次连接的多层卷积神经网络,用于根据降维数据得到低维数据,第n层卷积神经网络根据输入的隐藏层特征ln得到输出的隐藏层特征ln+1的表达式为:式中conv()为卷积操作,fc(ln)为对隐藏层特征ln经由注意力加权得到的注意力特征权重,softmax()为softmax操作,为按位加权操作,第1层卷积神经网络对应的隐藏层特征l1为降维数据,最后一层卷积神经网络输出的隐藏特征为低维数据。

10、专利技术的作用与效果

11、根据本专利技术所涉及的基于自注意机制的vae的数据降维方法及预测装置,因为一方面,根据变分自编码器的编码器构建降维模型进行高维生化数据的降维操作,并在编码器中使用注意力机制,使每层降维的特征能够兼具前一层的信息,从而使降维模型输出的低维数据具有更丰富的数据信息;另一方面,通过包含对应各个组学的多个降维模型的低维数据生成模块对多项高维生化数据进行降维处理得到对应的低维数据,并通过统一向量生成模块对所有低维数据进行堆叠得到包含不同组学诸多信息的统一向量。所以,本专利技术的基于自注意机制的vae的数据降维方法及预测装置具有较好的数据降维效果,进而能够得到准确的主动脉夹层预后预测结果。

本文档来自技高网...

【技术保护点】

1.一种基于自注意机制的VAE的高维生化数据降维方法,用于生成高维生化数据对应的低维数据,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于自注意机制的VAE的高维生化数据降维方法,其特征在于:

3.根据权利要求1所述的基于自注意机制的VAE的高维生化数据降维方法,其特征在于:

4.根据权利要求1所述的基于自注意机制的VAE的高维生化数据降维方法,其特征在于:

5.根据权利要求1所述的基于自注意机制的VAE的高维生化数据降维方法,其特征在于:

6.根据权利要求1所述的基于自注意机制的VAE的高维生化数据降维方法,其特征在于:

7.根据权利要求1所述的基于自注意机制的VAE的高维生化数据降维方法,其特征在于:

8.一种基于自注意机制的VAE的主动脉夹层预后预测装置,用于根据采集的多项高维生化数据生成对应的主动脉夹层预后预测结果,其特征在于,包括:

【技术特征摘要】

1.一种基于自注意机制的vae的高维生化数据降维方法,用于生成高维生化数据对应的低维数据,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于自注意机制的vae的高维生化数据降维方法,其特征在于:

3.根据权利要求1所述的基于自注意机制的vae的高维生化数据降维方法,其特征在于:

4.根据权利要求1所述的基于自注意机制的vae的高维生化数据降维方法,其特征在于:

5....

【专利技术属性】
技术研发人员:李双双冯家烜周建董健景在平陆清声贺佳赵凯文
申请(专利权)人:中国人民解放军海军军医大学第一附属医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1