一种应用于表征学习的多模型线性融合ModelEnsemble方法技术

技术编号：36566445 阅读：14 留言：0更新日期：2023-02-04 17:22

本发明专利技术涉及一种应用于表征学习的多模型线性融合Model Ensemble方法，属于人工智能领域。本发明专利技术使用ArcFace技术将多个分类模型的表征输出投影到超球面，并满足较小的类内距离和较大的类间距离。并且基于融合表征需满足线性关系的假设，将线性层的参数进行固定，通过优化损失函数，将模型学习的表征引导在同一个线性空间下之后，再对输出进行线性加权平均融合，从而得到最后的表征。本方法通过对不同AI模型进行线性集成，能够对样本学习到更稳定、准确的表征，并对下游任务效果如分类、识别、查询等有显著的提高。询等有显著的提高。询等有显著的提高。

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于表征学习的多模型线性融合Model Ensemble方法

[0001]本专利技术涉及人工智能
，更具体地说，涉及一种应用于表征学习的多模型线性融合Model Ensemble方法。

技术介绍

[0002]表征学习是人工智能的重要研究领域之一。基于样本特征将其表示在高维空间中的一组向量。模型学习到不同的向量空间意味着对样本提取的不同的特征组合，以及给予特征不同的权重。单模型只能讲学习样本投射到一个空间，而不同的模型集成可以将样本从不同的空间来进行比较学习，从而进行更全面的特征提取。在基于线性融合的方法中，现有的方法知识对已有的表征进行不同方式的线性组合，而忽略了表征之间的关系。不同的模型被激活的神经元不同，导致其拟合函数不同，进而得到的表征存在非线性关系，导致强行对其进行线性融合导致混乱的表征，从而造成性能的损失。

技术实现思路

[0003]1.专利技术要解决的技术问题
[0004]本专利技术的目的在于提供一种应用于表征学习的多模型线性融合Model Ensemble方法，本方法可以融合不同模型。
[0005]2.技术方案
[0006]为达到上述目的，本专利技术提供的技术方案为：
[0007]本专利技术的一种应用于表征学习的多模型线性融合Model Ensemble方法，对于不同的训练模型，使用ArcFace技术将多个分类模型的表征输出投影到超球面，基于两个能够进行线性融合的模型需要满足线性关系的假设，采用将最佳训练模型的线性层替换的方法，用最佳训练模型线...

【技术保护点】

【技术特征摘要】
1.一种应用于表征学习的多模型线性融合Model Ensemble方法，其特征在于：对于不同的训练模型，使用ArcFace技术将多个分类模型的表征输出投影到超球面，基于两个能够进行线性融合的模型需要满足线性关系的假设，采用将最佳训练模型的线性层替换的方法，用最佳训练模型线性层替换其他模型的线性层并增加一层线性投影的训练，使得所有模型的输出表征在同一个线性空间，以此满足假设，进而进行线性模型的融合。2.根据权利要求1所述的一种应用于表征学习的多模型线性融合Model Ensemble方法，其特征在于：Argface技术通过对样本的输出向量x
i
以及投影后的表征以及对应的one
‑
hot标签，构造如下损失函数：其中N表示样本数，n表示分类数，s是超球面的半径，即归一化参数，其中N表示样本数，n表示分类数，s是超球面的半径，即归一化参数，其中3.根据权利要求1所述的一种应用于表征学习的多模型线性融合Model Ensemble方法，其特征在于...

【专利技术属性】
技术研发人员：连德富，陈钢，熊哲立，杨启冲，
申请(专利权)人：长三角信息智能创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人