一种二值化目标检测神经网络结构和模型的训练方法技术

技术编号:34384023 阅读:17 留言:0更新日期:2022-08-03 21:04
本发明专利技术提供了一种二值化目标检测神经网络的训练方法。该方法包括:构建二值化目标检测神经网络,二值化目标检测神经网络包括骨干网络、共享特征池网络、分类解耦网络和定位解耦网络;对二值化目标检测神经网络进行基于多维度联合匹配的目标检测任务一致性训练;对二值化目标检测神经网络进行分类和定位任务的同步优化。本发明专利技术通过改进的锚框Anchor采样策略和基于关联性约束的新型损失函数算法解决二值化目标检测神经网络中Anchor采样的任务不一致性问题,并通过带有动态可学习权重的目标损失函数对二值化目标检测神经网络进行分类和定位任务的同步优化,能够提升检测框的质量、改善二值化目标检测神经网络的检测精准度和算法的鲁棒性。和算法的鲁棒性。和算法的鲁棒性。

【技术实现步骤摘要】
一种二值化目标检测神经网络结构和模型的训练方法


[0001]本专利技术涉及神经网络
,尤其涉及一种二值化目标检测神经网络结构和模型的训练方法。

技术介绍

[0002]目标检测神经网络二值量化指将32比特浮点格式的神经网络压缩到1比特定点数格式,以减少存储和计算代价。对目标检测神经网络权重和激活进行二值化能减少32倍的存储和64倍计算成本,这些特定使得二值化目标检测神经网络特别适合于在资源有限的低成本边缘计算设备上部署。
[0003]目前,现有技术中的二值化目标检测神经网络有Bi

Det,Auto

BiDet,和LWS

Det。其中,Bi

Det主要是通过信息瓶颈理论对二值化目标检测神经网络中冗余信息进行去除,即限制高层(high

level)特征图的信息量,最大化特征图和目标检测头(head)之间的互信息。在Bi

Det的基础上,Auto

BiDet增加了根据输入数据特性控制信息瓶颈的压缩水平功能,即对低复杂性的图片采用较低的压缩水平,对高复杂性的图片采用较高的压缩水平,实现了对高层特征图的信息量的动态压缩。LWS

Det(Layer

wise Searching for 1

bit Detectors逐层搜索二值检测器)引入angular(角度)和amplitude(振幅)损失函数来增加二值化目标检测神经网络的容量。该方法在1

bit量化层,利用可微分二值化搜索来最小化学生

教师指导网络框架中的角度误差,并通过在相同的学生

教师指导网络框架中最小化振幅损失来学习比例因子,以此增大二值化目标检测神经网络的网络容量,提高二值化目标检测神经网络的性能。
[0004]尽管二值化目标检测神经网络可以有效减少存储和计算代价,但由于二值神经网络本身信息容量有限,导致目前现有技术中的二值化目标检测神经网络存在严重的目标定位和目标分类特征信息提取不平衡问题(即神经网络在进行定位和分类任务时性能表现不一致)。相比于全精度目标检测神经网络,二值化目标检测神经网络在进行实际场景的部署和应用时会面临检测精度的大幅度下降的问题。以基准目标检测神经网络SSD300

VGG16为例,基于其的典型二值化目标检测神经网络BiDet在PASCAL VOC数据集上的精度仅为66.0%(mAP),和对应的基准全精度目标检测神经网络在PASCAL VOC数据集上的精度74.3%相比,精度下降了8.3%。另外,另一种经过进一步优化的二值化目标检测神经网络AutoBiDet在COCO数据集上实现了14.3%(mAP@[.5,.95]),和对应的全精度神经网络在COCO数据集上精度23.2%(mAP@[.5,.95])相比,精度下降了8.9%。

技术实现思路

[0005]本专利技术的实施例提供了一种二值化目标检测神经网络结构和模型的训练方法,以实现二值化目标检测神经网络的分类和定位任务一致性的较优性能。
[0006]为了实现上述目的,本专利技术采取了如下技术方案。
[0007]一种二值化目标检测神经网络结构和模型的训练方法,包括:
[0008]构建二值化目标检测神经网络,所述二值化目标检测神经网络包括骨干网络、共享特征池网络、分类解耦网络和定位解耦网络;
[0009]对所述二值化目标检测神经网络进行基于多维度联合匹配的目标检测任务一致性训练;
[0010]对所述二值化目标检测神经网络进行分类和定位任务的同步优化。
[0011]优选地,所述的构建二值化目标检测神经网络,所述二值化目标检测神经网络包括骨干网络、共享特征池网络、分类解耦网络和定位解耦网络,包括:
[0012]构建包括骨干网络和共享特征池网络的二值化目标检测神经网络,对所述共享特征池网络进行网络特征解耦分支处理,得到两组包括一系列特征解耦块的特征解耦分支网络;
[0013]利用其中一只特征解耦分支网络进行分类任务特征学习得到分类解耦网络,利用另外一只特征解耦分支网络进行定位任务特征学习得到定位解耦网络,所述特征解耦分支网络中的特征解耦块和共享特征池网络相连接,每一个特征解耦块通过对共享特征池网络的特定层应用解耦码来学习特定的特征。
[0014]优选地,所述的对所述二值化目标检测神经网络进行基于多维度联合匹配的目标检测任务一致性训练,包括:
[0015]设计改进的锚框采样策略,该锚框采样策略综合考虑锚框的位置信息和语义信息多模态信息,通过检测框的置信度分数Conf_score来修正真值标签和锚框之间的交并比IOU
Anchor
,得到修正后的交并比IOU
Amendment
,如公式(5)所示:
[0016][0017]σ和Th
r
取常数值,其中,σ为用来调整交并比修正强度的超参数,Th
r
为置信度分数筛选门限值;
[0018]所述锚框采样策略采用新的关联性约束损失函数L
relevance
,L
relevance
通过增大检测框的置信度分数Conf_score和与其对应的真值标签之间修正后的交并比IOU
Amendment
之间的线性关联性,来减少Conf_score和真值标签之间的差距,增大分类和定位任务性能评价指标的一致性,如公式(6)所示:
[0019]L
relevance
=|Conf_score

IOU
Amendment
|
ꢀꢀ
(6)。
[0020][0021]优选地,所述的对所述二值化目标检测神经网络进行分类和定位任务的同步优化,包括:
[0022]设计带有动态可学习权值的目标损失函数,分别计算分类和定位任务损失目标函数的相对变化值a
cls
(t

1)和a
loc
(t

1),如公式(7)和(8)所示,其中t表示训练时间,在softmax层加上了蒸馏温度T,如公式(9)和(10)所示,得到分类和定位损失函数的动态权重值λ
cls
(t)和λ
loc
(t),最后得到目标检测的动态可学习权值的目标损失函数L
loss
(t),如公式(11)所示,该目标损失函数通过动态学习权重的方式实现同步优化目标检测分类和定位任务:
[0023][0024][0025][0026][0027]L
loss
(t)=λ
cls
(t)L
cls
(t)+λ
loc
(t)L
loc
(t)+L
relevance
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种二值化目标检测神经网络结构和模型的训练方法,其特征在于,包括:构建二值化目标检测神经网络,所述二值化目标检测神经网络包括骨干网络、共享特征池网络、分类解耦网络和定位解耦网络;对所述二值化目标检测神经网络进行基于多维度联合匹配的目标检测任务一致性训练;对所述二值化目标检测神经网络进行分类和定位任务的同步优化。2.根据权利要求1所述的方法,其特征在于,所述的构建二值化目标检测神经网络,所述二值化目标检测神经网络包括骨干网络、共享特征池网络、分类解耦网络和定位解耦网络,包括:构建包括骨干网络和共享特征池网络的二值化目标检测神经网络,对所述共享特征池网络进行网络特征解耦分支处理,得到两组包括一系列特征解耦块的特征解耦分支网络;利用其中一只特征解耦分支网络进行分类任务特征学习得到分类解耦网络,利用另外一只特征解耦分支网络进行定位任务特征学习得到定位解耦网络,所述特征解耦分支网络中的特征解耦块和共享特征池网络相连接,每一个特征解耦块通过对共享特征池网络的特定层应用解耦码来学习特定的特征。3.根据权利要求2所述的方法,其特征在于,所述的对所述二值化目标检测神经网络进行基于多维度联合匹配的目标检测任务一致性训练,包括:设计改进的锚框采样策略,该锚框采样策略综合考虑锚框的位置信息和语义信息多模态信息,通过检测框的置信度分数Conf_score来修正真值标签和锚框之间的交并比IOU
Anchor
,得到修正后的交并比IOU
Amendment
,如公式(5)所示:σ和Th
r
取常数值,其中,σ为用来调整交并比修正强度的超参数,Th
r
为置信度分数筛选门限值;所述锚框采样策略采用新的关联性约束损失函数L
relevance
,L
relevance
通过增大检测框的置信度分数Conf_score和与其对应的真值标签之间修正后的交并比IOU
Amendment
之间的线性关联性,来减少Conf_score和真值标签之间的差距,增大分类和定位任务性能评价指标的一致性,如公式(6)所示:L
relevance
=|Conf_s...

【专利技术属性】
技术研发人员:王东普菡李浥东
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1