图像识别模型的训练方法、装置、设备和介质制造方法及图纸

技术编号:27812429 阅读:15 留言:0更新日期:2021-03-30 09:52
本公开公开了一种图像识别模型的训练方法、装置、设备和介质,涉及图像处理技术领域,具体涉及深度学习、计算机视觉等人工智能技术领域。该图像识别模型包括第一骨干网络,该训练方法包括:采用所述第一骨干网络提取样本图像的第一图像特征;采用第二骨干网络提取所述样本图像的第二图像特征,所述第二骨干网络与所述第一骨干网络的结构相同;融合所述第一图像特征和所述第二图像特征,以得到融合图像特征;基于所述融合图像特征,更新所述第一骨干网络的参数,并保持所述第二骨干网络的参数不变,以得到所述图像识别模型。本公开可以提高图像识别模型的识别准确度。图像识别模型的识别准确度。图像识别模型的识别准确度。

【技术实现步骤摘要】
图像识别模型的训练方法、装置、设备和介质


[0001]本公开涉及图像处理
,具体涉及深度学习、计算机视觉等人工智能
,尤其涉及一种图像识别模型的训练方法、装置、设备和介质。

技术介绍

[0002]人工智能(Artificial Intelligence,AI)是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]图像识别技术是通过机器学习的手段提取图像特征,通过提取的图像特征来区分不同图像的技术。在图像识别领域中,训练模型往往使用骨干网络(boneback)加载预训练模型,以获取更好的初始参数。
[0004]相关技术中,图像识别模型训练时,仅使用单一的骨干网络,通过该单一的骨干网络加载预训练模型后,执行训练过程,以得到图像识别模型。

技术实现思路

[0005]本公开提供了一种图像识别模型的训练方法、装置、设备和介质。
[0006]根据本公开的一方面,提供了一种图像识别模型的训练方法,所述图像识别模型包括第一骨干网络,所述方法包括:采用第一骨干网络提取样本图像的第一图像特征;采用第二骨干网络提取所述样本图像的第二图像特征,所述第二骨干网络与所述第一骨干网络的结构相同;融合所述第一图像特征和所述第二图像特征,以得到融合图像特征;基于所述融合图像特征,更新所述第一骨干网络的参数,并保持所述第二骨干网络的参数不变,以得到所述图像识别模型。
[0007]根据本公开的另一方面,提供了一种图像识别模型的训练装置,所述图像识别模型包括第一骨干网络,所述装置包括:第一提取单元,用于采用第一骨干网络提取样本图像的第一图像特征;第二提取单元,用于采用第二骨干网络提取所述样本图像的第二图像特征,所述第二骨干网络与所述第一骨干网络的结构相同;融合单元,用于融合所述第一图像特征和所述第二图像特征,以得到融合图像特征;训练单元,用于基于所述融合图像特征,更新所述第一骨干网络的参数,并保持所述第二骨干网络的参数不变,以得到所述图像识别模型。
[0008]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。
[0009]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储
介质,其中,所述计算机指令用于使所述计算机执行根据上述任一方面的任一项所述的方法。
[0010]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一方面的任一项所述的方法。
[0011]根据本公开的技术方案,可以提高图像识别模型的识别准确度。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1是根据本公开第一实施例的示意图;
[0015]图2是根据本公开第二实施例的示意图;
[0016]图3是根据本公开第三实施例的示意图;
[0017]图4是根据本公开第四实施例的示意图;
[0018]图5是根据本公开第五实施例的示意图;
[0019]图6是根据本公开第六实施例的示意图;
[0020]图7是用来实现本公开实施例的图像识别模型的训练方法中任一方法的电子设备的示意图。
具体实施方式
[0021]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0022]图像识别模型训练时,可以基于骨干网络(backbone)进行训练。骨干网络通过加载预训练模型进行参数初始化,相对于随机初始化的参数,图像识别模型更容易收敛。预训练模型基于大数据集,比如ImageNet,训练后得到,因此,预训练模型的参数较优。但是,相关技术中,图像识别模型训练时,会更新该单一的骨干网络的参数,也就破坏了预训练模型本身具有的优良的参数,从而使得训练后得到的图像识别模型的识别精度不足。
[0023]为了解决相关技术中存在的图像识别模型的精度不足的问题,本公开提供如下一些实施例。
[0024]图1是根据本公开第一实施例的示意图。本实施例提供一种图像识别模型的训练方法,所述图像识别模型包括第一骨干网络,所述方法包括:
[0025]101、采用所述第一骨干网络提取样本图像的第一图像特征。
[0026]102、采用第二骨干网络提取所述样本图像的第二图像特征,所述第二骨干网络与所述第一骨干网络的结构相同。
[0027]103、融合所述第一图像特征和所述第二图像特征,以得到融合图像特征。
[0028]104、基于所述融合图像特征,更新所述第一骨干网络的参数,并保持所述第二骨干网络的参数不变,以得到所述图像识别模型。
[0029]与相关技术中训练阶段采用的骨干网络仅有一个不同,本实施例中,在训练阶段设置两个骨干网络,即,除了图像识别模型本身具有的一个骨干网络(称为第一骨干网络)之外,还设置另一个骨干网络(称为第二骨干网络),两者结构相同。
[0030]初始时,第一骨干网络和第二骨干网络的初始参数相同,该初始参数比如是通过加载预训练模型进行初始化后得到的。图像识别模型训练时,通过第二骨干网络保持预训练模型的优良的参数,通过第一骨干网络在目标训练集上进行训练,以得到图像识别模型。
[0031]第一骨干网络进行训练时,可以采用反向传播(Back Propagation,BP)算法,更新第一骨干网络的参数。第二骨干网络不进行训练,不进行训练也可以称为保持参数不变,或者,停止梯度传播或者固定梯度。比如,参见图2,表示了训练过程中第一骨干网络和第二骨干网络的参数变化情况,针对样本图像,第一骨干网络采用了BP算法更新参数,图2中表示为采用梯度下降更新参数;第二骨干网络保持参数不变,图2中表示为采用固定梯度保持参数不变。
[0032]第一骨干网络和第二骨干网络可以采用各种已有的预训练模型对应的骨干网络,比如,vgg、resne(x)t、densenet、xception等。为了保证图像特征提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法,所述图像识别模型包括第一骨干网络,所述方法包括:采用所述第一骨干网络提取样本图像的第一图像特征;采用第二骨干网络提取所述样本图像的第二图像特征,所述第二骨干网络与所述第一骨干网络的结构相同;融合所述第一图像特征和所述第二图像特征,以得到融合图像特征;基于所述融合图像特征,更新所述第一骨干网络的参数,并保持所述第二骨干网络的参数不变,以得到所述图像识别模型。2.根据权利要求1所述的方法,其中,所述第一骨干网络和所述第二骨干网络包括多个网络段;所述第一图像特征包括:所述第一骨干网络的各个网络段的输出图像特征;所述第二图像特征包括:所述第二骨干网络的各个网络段的输出图像特征;所述融合所述第一图像特征和所述第二图像特征,包括:将对应同一个网络段的所述第一图像特征和所述第二图像特征,进行融合。3.根据权利要求2所述的方法,其中,所述将对应同一个网络段的所述第一图像特征和所述第二图像特征,进行融合,包括:将对应同一个网络段的所述第一图像特征和所述第二图像特征,进行相加,以将相加后的图像特征作为所述融合图像特征。4.根据权利要求2所述的方法,其中,所述图像识别模型还包括分类网络,所述基于所述融合图像特征,更新所述第一骨干网络的参数,并保持所述第二骨干网络的参数不变,以得到所述图像识别模型,包括:对应所述各个网络段,将所述网络段对应的融合图像特征,作为所述第一骨干网络中所述网络段的下一个网络段的输入,直至通过所述分类网络输出所述样本图像的预测值;基于所述预测值和所述样本图像对应的标签数据,计算损失函数;基于反向传播算法,更新所述第一骨干网络的参数和所述分类网络的参数,以及,保持所述第二骨干网络的参数不变,直至所述损失函数收敛;将所述损失函数收敛时对应的所述第一骨干网络和所述分类网络,组成所述图像识别模型。5.根据权利要求4所述的方法,其中,还包括:从所述图像识别模型对应的目标训练集中,获取所述样本图像和所述样本图像对应的标签数据。6.根据权利要求1

5任一项所述的方法,其中,还包括:采用所述第一骨干网络和所述第二骨干网络分别加载预训练模型,并采用所述预训练模型初始化所述第一骨干网络的参数和所述第二骨干网络的参数。7.一种图像识别模型的训练装置,所述图像识别模型包括第一骨干网络,所述装置包括:第一提取单元,用于采用所述第一骨干网络提取样本图像的第一图像特征;第二提取单元,用于采用第二骨干网络提取所述样本图像的第二图像特征,所述第二骨干网络与所述第一骨干网络的结构相同;
融合...

【专利技术属性】
技术研发人员:崔程
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1