单阶段目标检测模型训练方法、装置及存储介质制造方法及图纸

技术编号:37991919 阅读:9 留言:0更新日期:2023-06-30 10:06
本公开公开了单阶段目标检测模型训练方法、装置及存储介质,涉及深度学习、计算机视觉及智能影像等人工智能领域,其中的方法可包括:在单阶段目标检测模型的训练过程中,当需要进行分类损失计算时,分别获取不同尺度的特征图对应的损失函数值,所述损失函数为焦点损失函数;根据获取到的各损失函数值确定出最终的损失函数值,根据最终的损失函数值进行单阶段目标检测模型的训练。应用本公开所述方案,可提升模型训练效果及模型性能等。可提升模型训练效果及模型性能等。可提升模型训练效果及模型性能等。

【技术实现步骤摘要】
单阶段目标检测模型训练方法、装置及存储介质


[0001]本公开涉及人工智能
,特别涉及深度学习、计算机视觉及智能影像等领域的单阶段目标检测模型训练方法、装置及存储介质。

技术介绍

[0002]智能眼底筛查系统是指在无专业眼科医生的诊断经验辅助下,根据受检者的眼底视网膜图像信息,并结合受检者的身体相关状况信息而自主地作出符合医生诊断经验的智能决策系统。目前的智能眼底筛查系统多基于深度学习技术实现,主要可分为黑盒模型和白盒模型两类。其中,白盒模型能够在输出诊断结果的同时给出相关病灶位置的定位等,因此在实际应用中具有更重要的意义。
[0003]白盒模型主要有两种实现方式,一种为端云交互的方式,另一种为采用本地智能终端硬件自主决策的方式,即直接将待筛查的图像在本地的智能终端上进行诊断决策。在后一种方式中,通常采用单阶段目标检测模型(或称为单阶段目标检测器等)来实现诊断决策。而在单阶段目标检测模型中,特征金字塔网络(FPN,Feature Pyramid Networks)和焦点损失函数(Focal loss)是通用的结构与组件。现有的单阶段目标检测模型的主流实现方法中,FPN中的不同尺度的特征图对应统一的损失函数值,从而忽略了各尺度间的差异,进而导致模型训练效果不佳,降低了模型性能等。

技术实现思路

[0004]本公开提供了单阶段目标检测模型训练方法、装置及存储介质。
[0005]一种单阶段目标检测模型训练方法,包括:
[0006]在单阶段目标检测模型的训练过程中,当需要进行分类损失计算时,分别获取不同尺度的特征图对应的损失函数值,所述损失函数为焦点损失函数;
[0007]根据获取到的各损失函数值确定出最终的损失函数值,根据所述最终的损失函数值进行所述单阶段目标检测模型的训练。
[0008]一种单阶段目标检测模型训练装置,包括:第一训练模块以及第二训练模块;
[0009]所述第一训练模块,用于在单阶段目标检测模型的训练过程中,当需要进行分类损失计算时,分别获取不同尺度的特征图对应的损失函数值,所述损失函数为焦点损失函数;
[0010]所述第二训练模块,用于根据获取到的各损失函数值确定出最终的损失函数值,根据所述最终的损失函数值进行所述单阶段目标检测模型的训练。
[0011]一种电子设备,包括:
[0012]至少一个处理器;以及
[0013]与所述至少一个处理器通信连接的存储器;其中,
[0014]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如以上所述的方法。
[0015]一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行如以上所述的方法。
[0016]一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如以上所述的方法。
[0017]上述公开中的一个实施例具有如下优点或有益效果:可利用不同尺度分别对应的损失函数值代替统一的损失函数值,从而实现了不同尺度的针对性优化等,进而提升了模型训练效果及模型性能等。
[0018]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0019]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0020]图1为本公开所述单阶段目标检测模型训练方法实施例的流程图;
[0021]图2为本公开所述统计结果的示意图;
[0022]图3为现有单阶段目标检测模型的训练过程示意图;
[0023]图4为本公开所述基于Anchor的单阶段目标检测模型的结构示意图;
[0024]图5为本公开所述单阶段目标检测模型训练装置实施例50的组成结构示意图;
[0025]图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。
具体实施方式
[0026]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0027]另外,应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0028]图1为本公开所述单阶段目标检测模型训练方法实施例的流程图。如图1所示,包括以下具体实现方式。
[0029]在步骤101中,在单阶段目标检测模型的训练过程中,当需要进行分类损失计算时,分别获取不同尺度的特征图对应的损失函数值,所述损失函数为Focal loss。
[0030]在步骤102中,根据获取到的各损失函数值确定出最终的损失函数值,根据最终的损失函数值进行单阶段目标检测模型的训练。
[0031]现有的单阶段目标检测模型主要分为两种,一种是基于Anchor(预设框)的单阶段目标检测模型(Anchor

based one

stage detector),主要以目标检测网络(RetinaNet)模型和高效检测(EfficientDet)模型为代表,其核心是通过FPN所带来的自顶向上结构来增加不同分辨率的特征融合程度,并通过Focal loss对训练中的难例样本进行在线挖掘,在模型的训练和推理过程中,通过计算与Anchor之间的偏移量来进行正负样本匹配,另一种是不基于Anchor的单阶段目标检测模型(Anchor

free one

stage detector),以全卷积单
阶段目标检测(FCOS,Fully Convolutional One

Stage Object Detection)模型为例,其同样是通过FPN和Focal loss的结合来进行模型训练,与第一种不同的是其主要通过关键点位置等相关信息来进行正负样本匹配。
[0032]以RetinaNet模型为例,在RetinaNet模型的训练过程中,每张图像上的真值(Groundtruth)会根据交并比(IoU,Intersection

over

Union)大小去匹配不同层的Anchor,并选择IoU最大的Anchor进行分类loss和边框(bounding box)回归loss的计算。
[0033]针对通用目标检测数据集(COCO,Common Objects in Context),可统计一轮迭代过程中Anchor所能匹配到的正样本个数,以及潜在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种单阶段目标检测模型训练方法,包括:在单阶段目标检测模型的训练过程中,当需要进行分类损失计算时,分别获取不同尺度的特征图对应的损失函数值,所述损失函数为焦点损失函数;根据获取到的各损失函数值确定出最终的损失函数值,根据所述最终的损失函数值进行所述单阶段目标检测模型的训练。2.根据权利要求1所述的方法,其中,所述分别获取不同尺度的特征图对应的损失函数值包括:针对任一尺度,分别进行以下处理:分别获取匹配到所述尺度的各样本对应的损失函数值;计算各样本对应的损失函数值的均值,将所述均值作为所述尺度对应的损失函数值。3.根据权利要求2所述的方法,其中,所述分别获取匹配到所述尺度的各样本对应的损失函数值包括:针对任一尺度,分别进行以下处理:获取所述尺度对应的第一参数,所述第一参数表示难例样本挖掘程度;针对匹配到所述尺度的任一样本,分别根据所述样本对应的预测概率值、所述第一参数、第二参数以及第三参数计算出所述样本对应的损失函数值,所述第二参数表示正样本权重,所述第三参数表示样本标签。4.根据权利要求3所述的方法,其中,所述获取所述尺度对应的第一参数包括:针对任一尺度,在训练过程中的每个批次内,分别根据所述批次内匹配到所述尺度的各样本的平均难易程度确定出所述尺度对应的第一参数。5.根据权利要求4所述的方法,其中,所述根据所述批次内匹配到所述尺度的各样本的平均难易程度确定出所述尺度对应的第一参数包括:计算所述批次内匹配到所述尺度的各正样本对应的预测概率值的均值,对所述均值取对数,将取对数结果的负数作为所述尺度对应的第一参数。6.根据权利要求1所述的方法,其中,所述根据获取到的各损失函数值确定出最终的损失函数值包括:计算获取到的各损失函数值的均值,将所述均值作为所述最终的损失函数值。7.一种单阶段目标检测模型训练装置,包括:第一训练模块以及第二训练模块;所述第一训练模块,用于在单阶段目标检测模型的训练过程中,当需要进行分类损失计算时,分别获取不同尺度的特征图对应的损失函数值,所述损失函数为焦点损失函数;所述第二...

【专利技术属性】
技术研发人员:武秉泓杨叶辉杨大陆许言午王磊李乾
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1