网络训练方法、装置、芯片、终端设备及存储介质制造方法及图纸

技术编号:37277474 阅读:22 留言:0更新日期:2023-04-20 23:44
本申请实施例提供一种网络训练方法、装置、芯片、终端设备及存储介质,该网络训练方法包括:获取特征图,特征图包括目标标注框;在特征图上设置K个先验锚点框,K为大于或等于2的整数;确定K个先验锚点框中的正样本锚点框和负样本锚点框,其中,正样本锚点框的中心点在目标标注框内;将特征图输入目标检测网络,计算每个先验锚点框的损失,基于每个先验锚点框的损失对目标检测网络进行优化。本申请实施例可以提高目标检测网络的训练效果。可以提高目标检测网络的训练效果。可以提高目标检测网络的训练效果。

【技术实现步骤摘要】
网络训练方法、装置、芯片、终端设备及存储介质


[0001]本申请涉及机器学习
,具体涉及一种网络训练方法、装置、芯片、终端设备及存储介质。

技术介绍

[0002]而随着人工智能的发展,基于卷积神经网络的目标检测网络已经成为了一种主流的目标检测方法。目标检测网络的训练中重要的一环就是训练样本,一是对正负样本的分类策略决定了正样本的质量,二是一般检测网络都存在正负样本不平衡和难易样本不均衡的问题,会导致网络训练困难。
[0003]目前,一般采用设置交并比阈值作为正负样本分类的策略,即对预设的样本框基于交并比阈值进行正负样本的分类,如果交并比阈值大于设定的阈值,则判定该样本是正样本,否则为负样本。然而,仅采用交并比阈值作为正负样本的判别标准,该判别标准过于单一,且交并比阈值并不能很全面地反应样本的质量,交并比阈值的取值对于正负样本的质量影响非常大,使得目标检测网络的训练效果较差。

技术实现思路

[0004]本申请实施例提供一种网络训练方法、装置、芯片、终端设备及存储介质,可以提高目标检测网络的训练效果。
[0005]本申请实施例的第一方面提供了一种网络训练方法,包括:
[0006]获取特征图,所述特征图包括目标标注框;
[0007]在所述特征图上设置K个先验锚点框,K为大于或等于2的整数;
[0008]确定所述K个先验锚点框中的正样本锚点框和负样本锚点框,其中,所述正样本锚点框的中心点在所述目标标注框内;
[0009]将所述特征图输入目标检测网络,计算每个先验锚点框的损失,基于每个先验锚点框的损失对所述目标检测网络进行优化。
[0010]本申请实施例的第二方面提供了一种芯片,包括处理器,所述处理器配置成执行本申请实施例第一方面中的步骤指令。
[0011]本申请实施例的第三方面提供了一种网络训练装置,包括:
[0012]获取单元,用于获取特征图,所述特征图包括目标标注框;
[0013]设置单元,用于在所述特征图上设置K个先验锚点框,K为大于或等于2的整数;
[0014]确定单元,用于确定所述K个先验锚点框中的正样本锚点框和负样本锚点框,其中,所述正样本锚点框的中心点在所述目标标注框内;
[0015]训练单元,用于将所述特征图输入目标检测网络,计算每个先验锚点框的损失,基于每个先验锚点框的损失对所述目标检测网络进行优化。
[0016]本申请实施例的第四方面提供了一种终端设备,包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述
程序指令,执行如本申请实施例第一方面中的步骤指令。
[0017]本申请实施例的第五方面提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如本申请实施例第一方面中的步骤指令。
[0018]本申请实施例的第六方面提供了一种计算机程序产品,其中,上述计算机程序产品包括计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如本申请实施例第一方面中的步骤指令。
[0019]本申请实施例的网络训练方法,获取特征图,特征图包括目标标注框;在特征图上设置K个先验锚点框,K为大于或等于2的整数;确定K个先验锚点框中的正样本锚点框和负样本锚点框,其中,正样本锚点框的中心点在目标标注框内;将特征图输入目标检测网络,计算每个先验锚点框的损失,基于每个先验锚点框的损失对目标检测网络进行优化。本申请实施例中,可以限制挑选的正样本锚点框的中心点在目标标注框内,较大程度上保证了正样本锚点框的质量,相较于仅通过交并比阈值来判定正负样本更具有鲁棒性,进而可以提高目标检测网络的训练效果。
附图说明
[0020]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本申请实施例提供的一种目标检测网络的结构示意图;
[0022]图2是本申请实施例提供的另一种目标检测网络的结构示意图;
[0023]图3是本申请实施例提供的一种网络训练方法的流程示意图;
[0024]图4是本申请实施例提供的一种设置先验锚点框的示意图;
[0025]图5是本申请实施例提供的一种先验锚点框对应的预测框、目标标注框和最小包围框的示意图;
[0026]图6是本申请实施例提供的一种网络训练装置的结构示意图;
[0027]图7是本申请实施例提供的一种终端设备的结构示意图。
具体实施方式
[0028]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0029]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
[0030]在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
[0031]本申请实施例所涉及到的终端设备是具备显示能力的设备。可以是手机、平板电脑、笔记本电脑、超级移动个人计算机(ultra

mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)、车载单元(On board Unit,OBU)、可穿戴设备(例如,手表、手环、智能头盔等)、智能家居设备(电饭煲、音响、家庭管家设备等)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备等。
[0032]本申请实施例的网络训练方法,可以限制挑选的正样本锚点框的中心点在目标标注框内,较大程度上保证了正样本锚点框的质量,相较于仅通过交并比阈值来判定正负样本更具有鲁棒性,进而可以提高目标检测网络的训练效果。以下具体进行说明。
[0033]请参阅图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络训练方法,其特征在于,包括:获取特征图,所述特征图包括目标标注框;在所述特征图上设置K个先验锚点框,K为大于或等于2的整数;确定所述K个先验锚点框中的正样本锚点框和负样本锚点框,其中,所述正样本锚点框的中心点在所述目标标注框内;将所述特征图输入目标检测网络,计算每个先验锚点框的损失,基于每个先验锚点框的损失对所述目标检测网络进行优化。2.根据权利要求1所述的方法,其特征在于,所述确定所述K个先验锚点框中的正样本锚点框和负样本锚点框,包括:确定所述K个先验锚点框中与所述目标标注框的距离小于第一阈值的M个候选正样本锚点框;计算每个候选正样本锚点框与所述目标标注框之间的交并比,从所述M个候选正样本锚点框中选择中心点在所述目标标注框内,并且交并比大于第二阈值的锚点框作为正样本锚点框;将所述K个先验锚点框中除所述正样本锚点框之外的锚点框作为负样本锚点框。3.根据权利要求2所述的方法,其特征在于,所述第二阈值等于交并比均值与交并比标准差之和;所述交并比均值为所述M个候选正样本锚点框与所述目标标注框之间的交并比均值,所述交并比标准差为所述M个候选正样本锚点框与所述目标标注框的交并比标准差。4.根据权利要求1所述的方法,其特征在于,所述在所述特征图上设置K个先验锚点框,包括:获得训练图像,对所述训练图像进行多尺度特征提取,得到多个不同尺寸的特征图;在每个尺寸的特征图上,设置不同尺寸的先验锚点框,得到每个尺寸的特征图对应的个先验锚点框。5.根据权利要求1~4任一项所述的方法,其特征在于,所述将所述特征图输入目标检测网络,计算每个先验锚点框的损失,包括:将所述特征图输入目标检测网络,得到每个先验锚点框的分类结果和回归结果;基于每个先验锚点框的分类结果计算每个先验锚点框的分类损失,基于每个先验锚点框的回归结果计算每个先验锚点框的回归损失;每个先验锚点框的损失包括每个先验锚点框的分类损失和回归损失。6.根据权利要求5所述的方法,其特征在于,所述基于每个先验锚点框的分类结果计算每个先验锚点框的分类损失,包括:在先验锚点框的分类结果为正样本的情况下,按照如下公式计算每个先验锚点框的分类损失:L1=

(1

p)
...

【专利技术属性】
技术研发人员:屈瑾
申请(专利权)人:哲库科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1