System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能算法,尤其涉及一种对车辆图像中目标进行识别的方法及装置。
技术介绍
1、随着深度学习的发展和大模型新成果的出现,目前深度学习模型变得越来越大,性能越来越好,随之而来的是计算量也越来越大,这种特点对于自动驾驶等场景并不友好,自动驾驶中的计算平台和功率有限,因此适合部署轻量化但性能够高的模型,因此有必要提供一种轻量化但性能够高的网络模型,以便部署在算力有限的自动驾驶等计算平台或算力有限的硬件设备中。
技术实现思路
1、本说明书实施例提供一种对车辆图像中目标进行识别的方法及装置,以提供轻量化但性能够高的网络模型,以便部署在算力有限的自动驾驶等计算平台或算力有限的硬件设备中。
2、为解决上述技术问题,本说明书实施例是这样实现的:
3、本专利技术提供一种对车辆图像中目标进行识别的方法,包括:
4、s1、搭建教师网络模型、学生网络模型,其中,所述教师网络模型为采用车辆图像数据集预先训练完毕的第一神经网络模型,所述学生网络模型为未经过训练的第二神经网络模型,所述学生网络模型中包含的参数量小于所述教师网络模型中包含的参数量;
5、s2、对所述学生网络模型中包含的参数进行初始化,并基于所述车辆图像数据集对所述学生网络模型进行若干轮次的预训练,从而得到预训练的学生网络模型;
6、s3、利用所述车辆图像数据集和所述教师网络模型对所述预训练的学生网络模型进行调整训练,以便将所述教师网络模型中蕴含的关于所述车辆图像数据集的知识传递
7、s31、将所述车辆图像数据集中的车辆图像进行编号,得到带序列信息的车辆图像数据集;
8、s32、将所述带序列信息的车辆图像数据集中的第一车辆图像输入所述教师网络模型中,得到第一输出特征f1,将所述带序列信息的车辆图像数据集中的第一车辆图像输入所述预训练的学生网络模型中,得到第二输出特征f2;由下述公式(1)基于所述第一输出特征f1和所述第二输出特征f2构建第一损失函数loss1:
9、loss1=||f1-f2||2 (1)
10、s33、将所述预训练的学生网络模型对所述第一车辆图像的输出类别的所有后验概率从大到小进行排序后表示为第一集合{p1,p2,p3,…,pn},其中,第i个后验概率pi对应的输出类别表示为ci;将所述教师网络模型对所述第一车辆图像的输出类别的所有后验概率从大到小进行排序后表示为第二集合{p1,p2,p3,…,pn},其中,第i个后验概率pi对应的输出类别表示为ci;符号i表示输出类别的序号,取值范围为1到n,符号n表示输出类别的总个数;
11、如果所述预训练的学生网络模型对所述第一车辆图像的第一输出类别c1与所述第一车辆图像对应的真实标签一致,则基于所述第一集合对pi/pi+1进行遍历计算,如果能找到pi/pi+1大于预先设定的第一阈值th1,则将所述第一输出类别c1至类别ci+1标记为重要竞争类别;如果不能找到pi/pi+1大于所述预先设定的第一阈值th1,则对所述预训练的学生网络模型输出的前k个后验概率进行累积求和,直至满足并将所述第一输出类别c1至类别ck标记为所述重要竞争类别,其中,符号th2表示预先设定的第二阈值;
12、如果所述第一输出类别c1与所述第一车辆图像对应的真实标签不一致,则对所述第一集合中的各个后验概率进行遍历,直至筛选出的第j个后验概率pj对应的输出类别与所述第一车辆图像对应的真实标签一致,并将所述第一输出类别c1至输出类别cj标记为所述重要竞争类别;
13、基于下述公式(2)构建第二损失函数loss2:
14、
15、其中,符号l表示所述要竞争类别中包括的类别的总个数;
16、步骤s34、在不改变待识别目标的目标类别的前提下,对所述第一车辆图像进行样本增强操作,扩充得到m个车辆图像样本;
17、将所述m个车辆图像样本输入到所述预训练的学生网络模型中,得到所述m个车辆图像样本的输出特征{f3,f4,f(m+2)},基于下述公式(3)构建第三损失函数loss3;
18、
19、基于下述公式(4)由所述第一损失函数loss1、所述第二损失函数loss2和所述第三损失函数loss3构建总体损失函数loss;
20、loss=αloss1+βloss2+(1-α-β)loss3 (4)
21、其中,符号abs(·)表示绝对值函数,符号α表示大于0小于1的第一加权参数,符号β表示大于0小于1的第二加权参数;
22、s35、基于所述总体损失函数loss采用误差反向传播算法对所述预训练的学生网络模型中的参数进行调整;
23、s36、对于所述带序列信息的车辆图像数据集中其余车辆图像逐个重复步骤s32至步骤s35,以便对所述学生网络模型中的参数进行不断调整,从而得到训练完毕的学生网络模型;
24、s4、将所述训练完毕的学生网络模型部署到对车辆图像中目标进行识别的硬件设备中。
25、优选的,在步骤s3中对所述预训练的学生网络模型进行调整训练的过程中进行两轮迭代训练,其中,第一轮迭代训练过程中将所述第一加权参数α设置为大于0.5小于1的常数,第二轮迭代训练过程中将所述第一加权参数α设置为小于0.2小于0的常数。
26、优选的,在步骤s34中,通过增加噪声、图像锐化、图像增强、亮度变化,随机增加或删减图像的四个边界的有限行或者列的像素内容的操作对当前的车辆图像进行样本增强操作以扩充样本模式。
27、优选的,步骤s2中对学生网络模型进行若干轮次的预训练方法是基于梯度下降的反向传播算法,采用的激活函数为sigmoid函数。
28、根据本专利技术的第二方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现前文的对车辆图像中目标进行识别的方法步骤。
29、根据本专利技术的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前文所述的对车辆图像中目标进行识别的方法步骤。
30、本说明书一个实施例至少能够达到以下有益效果:本专利技术提供一种对车辆图像中目标进行识别的方法,考虑到现有的基于后验概率分布的loss的知识蒸馏方法中,基于教师网络模型和学生网络模型所输出的后验概率的相似程度来计算损失函数,是计算系统包含所有类别在内的后验概率分布,但实际当模型准确度达到一定程度之后,系统的性能主要与当前待识别图像类别相近的几个类别密切相关(这几个类别对于当前类别来说是重要的竞争类别),对于不密切相关的类别,通过随机特征也可能可以轻易的区分开,因此这些类别参与计算得到的loss不能为引导小模型的性能提升提供有价值的信息,从而本申请技术方案中提出一种新的损失函数本文档来自技高网...
【技术保护点】
1.一种对车辆图像中目标进行识别的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的对车辆图像中目标进行识别的方法,其特征在于,其特征在于,在步骤S3中对所述预训练的学生网络模型进行调整训练的过程中进行两轮迭代训练,其中,第一轮迭代训练过程中将所述第一加权参数α设置为大于0.5小于1的常数,第二轮迭代训练过程中将所述第一加权参数α设置为小于0.2小于0的常数。
3.根据权利要求1所述的对车辆图像中目标进行识别的方法,其特征在于,其特征在于,在步骤S34中,通过增加噪声、图像锐化、图像增强、亮度变化,随机增加或删减图像的四个边界的有限行或者列的像素内容的操作对当前的车辆图像进行样本增强操作以扩充样本模式。
4.根据权利要求1所述的对车辆图像中目标进行识别的方法,其特征在于,其特征在于,步骤S2中对学生网络模型进行若干轮次的预训练方法是基于梯度下降的反向传播算法,采用的激活函数为Sigmoid函数。
5.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~4中任一权利要求所述的方法步骤。
...【技术特征摘要】
1.一种对车辆图像中目标进行识别的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的对车辆图像中目标进行识别的方法,其特征在于,其特征在于,在步骤s3中对所述预训练的学生网络模型进行调整训练的过程中进行两轮迭代训练,其中,第一轮迭代训练过程中将所述第一加权参数α设置为大于0.5小于1的常数,第二轮迭代训练过程中将所述第一加权参数α设置为小于0.2小于0的常数。
3.根据权利要求1所述的对车辆图像中目标进行识别的方法,其特征在于,其特征在于,在步骤s34中,通过增加噪声、图像锐化、图像增强、亮度变化,随机增加或删减图像的四个边界的有限行或者列的像素内容的操...
【专利技术属性】
技术研发人员:李军民,赵卫兵,王飞,吕掌权,郭文光,刘近平,
申请(专利权)人:安阳工学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。