一种挖掘特征间强相关性的类量子多层感知方法技术

技术编号:44980904 阅读:16 留言:0更新日期:2025-04-15 17:00
本发明专利技术公开了一种挖掘特征间强相关性的类量子多层感知方法,包括基于多体量子系统构建一个可以挖掘特征间强相关性的非线性神经网络层,进而基于所构建的神经网络层构造一个类量子多层感知机,使模型参数数量减少了数百倍。从理论上分析QiMLP挖掘特征间强相关性的原理和基础,不仅能够学习到特征间的强相关性,而且能够显著减少模型参数的数量,并通过实验验证了所构建的多层感知机的有效性。

【技术实现步骤摘要】

本专利技术涉及机器学习,尤其涉及一种挖掘特征间强相关性的类量子多层感知方法


技术介绍

1、多层感知机(multilayer perceptron,mlp)通过激活函数的非线性映射实现非线性关系的建模,并借助多个神经元层的组合以学习更抽象、更复杂的特征表示,进而捕捉数据中更深层次的结构和模式。虽然多层感知机是传统神经元层的简单应用实践,但在特定任务中却具有优越的性能和卓越的表现,是机器学习、深度学习和大型语言模型构建的基石。

2、然而,神经网络模型中各层神经元采用加权求和的方式融合上一层神经元输出的特征,其难以学习到特征之间的强相关性,无法捕捉特征间的内在强联系。该方法只是对特征的重要性赋予一定的权重值,并将所涉及的特征相加。现实世界中,事物的特征之间一般存在显性或隐性的强内在联系,如因果关系、强统计相关性等。因此,构建能够挖掘特征间强相关性的神经元层以捕捉事物特征间真实存在的强相关系或因果关系,是更有利于模型实施有效的决策。此外,基于传统神经元层构建的机器学习模型,例如深度学习模型、大型语言模型等,需要学习的参数量庞大,并且在训练过程中需要大本文档来自技高网...

【技术保护点】

1.一种挖掘特征间强相关性的类量子多层感知方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种挖掘特征间强相关性的类量子多层感知方法,其特征在于,所述S1具体包括,使用一个或多个Kronecker积运算将一个或多个小的权重矩阵组合起来以得到神经元层最终的权重矩阵。

3.根据权利要求2所述的一种挖掘特征间强相关性的类量子多层感知方法,其特征在于,神经元层的输入为NM维向量,即上一层神经元个数为NM,进行权重矩阵重构,构造最终权重矩阵使用的Kronecker积数量由模型适用的任务以及任务需要的参数数量综合决定。

4.根据权利要求1所述的一种挖掘特...

【技术特征摘要】

1.一种挖掘特征间强相关性的类量子多层感知方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种挖掘特征间强相关性的类量子多层感知方法,其特征在于,所述s1具体包括,使用一个或多个kronecker积运算将一个或多个小的权重矩阵组合起来以得到神经元层最终的权重矩阵。

3.根据权利要求2所述的一种挖掘特征间强相关性的类量子多层感知方法,其特征在于,神经元层的输入为nm维向量,即上一层神经元个数为nm,进行权重矩阵重构,构造最终权重矩阵使用的kronecker积数量由模型适用的任务以及任务需要的参数数量综合决定。

4.根据权利要求1所述的一种挖掘特征间强相关性的类量子多层感知方法,其特征在于,所述s2具体包括,使用一个或多个kronecker积运算将一个或多个小的偏置项组合起来以得到神经元层最终的偏置项。

5.根据权利要求4所述的一种挖掘特征间强相关性的类量子多层感知方法,其特征在于,根据最终的偏置项是nm维向量,表示重构后的最终的偏置项,构造偏置项使用的kronecker积数量与构造权重矩阵使用的kronecker积数量相对应。

6.根据权利要求1或3或5...

【专利技术属性】
技术研发人员:张俊伟李晓林
申请(专利权)人:中国科学院基础医学与肿瘤研究所筹
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1