一种融合多种表征平衡策略的室内场景视觉识别方法及系统技术方案

技术编号：37678927 阅读：30 留言：0更新日期：2023-05-26 04:45

本发明专利技术公开了一种融合多种表征平衡策略的室内场景视觉识别方法及系统，包括：使用预热好的模型计算长尾训练集中每个类别的类别中心；通过不同的重采样策略构建多个具有不同特征分布的训练子集；结合自定义的损失函数，使用所述训练子集对预热后的模型进行训练直至损失函数收敛，让模型倾向于学习到在各个训练子集间平衡的特征；处理训练集中类别内部的特征不平衡问题。同时在分类器上施加正则项来调整头尾部类的权重差异，当所述损失函数收敛到一定程度后得到训练好的模型，减少训练集中因为类别样本的不均衡造成的分类器上各类别权重的不平衡。本发明专利技术同时解决类别样本不均衡和类别内样本的非类别属性的不平衡给模型训练带来的问题。练带来的问题。练带来的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合多种表征平衡策略的室内场景视觉识别方法及系统

[0001]本专利技术涉及长尾视觉识别和平衡表征学习领域，尤其涉及一种融合多种表征平衡策略的室内场景视觉识别方法及系统。

技术介绍

[0002]长尾视觉识别是计算机视觉领域最具挑战性和关键的技术之一，因为任何自然采集获取的数据集都或多或少存在长尾分布的不平衡问题，这些隐患往往被人们忽视，从而对模型训练带来一些莫名其妙的影响。在之前的研究之中被人们关注的是类别间的不平衡，这在绝大多数计算机视觉任务中已经得到人工解决。比如现在公开的绝大多数数据集都会在自然采集后经过人工的类别均衡处理，所以除非是专门的长尾研究领域，目前公开的数据集大都是类别均衡的。但这不表示类别再平衡问题就是无意义的，因为这一研究会减弱自然采集的数据集后的人工类别均衡操作的必要性，减少这一环节的时间和人力成本。除了类别均衡问题，还有一类问题在之前并未得到关注，且未得到解决，就是类内的长尾不平衡问题，比如一些常见的现象：为什么同一类内的样本的表现不一致且呈现长尾分布；为什么尾部类的一些样本在视觉识别任务中会被预...

【技术保护点】

【技术特征摘要】
1.一种融合多种表征平衡策略的室内场景视觉识别方法，其特征在于，所述方法包括：S1、采样得到长尾训练集；S2、预热模型并自定义损失函数；S3、使用预热好的模型计算长尾训练集中每个类别的类别中心；S4、通过不同的重采样策略构建多个具有不同特征分布的训练子集；S5、结合自定义的损失函数，使用所述训练子集对预热后的模型进行训练直至损失函数收敛，让模型倾向于学习到在各个训练子集间平衡的特征；S6、在步骤S5中训练后模型的分类器上施加正则项来调整头尾部类的权重差异，当所述损失函数收敛到一定程度后得到训练好的模型。S7、使用训练好的模型进行视觉识别。2.根据权利要求1所述的一种融合多种表征平衡策略的室内场景视觉识别方法，其特征在于，所述通过不同的重采样策略构建多个具有不同特征分布的训练子集，包括：对长尾训练集中的每个类别分别使用不同重采样方式得到多个新的小子集，然后将所有使用相同重采样方式的小子集合在一起，得到多个大的训练子集。3.根据权利要求2所述的一种融合多种表征平衡策略的室内场景视觉识别方法，其特征在于，所述不同重采样方式包括：一种是对每个类别中的样本赋予同样的权重进行采样，另一种是按照二八定律对每个类别中的样本赋予权重进行采样。4.根据权利要求3所述的一种融合多种表征平衡策略的室内场景视觉识别方法，其特征在于，按照二八定律对每个类中的样本赋予权重进行采样，包括：对当前类别中部分样本进行上采样直到类别中预测置信度最低的百分之二十的样本的占比达到了原集合样本数的百分之八十；同时将当前类别中另外一部分样本通过下采样变为原集合样本数的百分之二十。5.根据权利要求4所述的一种融合多种表...

【专利技术属性】
技术研发人员：张宁，董乐，赵浩然，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人