目标检测模型训练方法、目标检测方法、装置、电子设备制造方法及图纸

技术编号:35016085 阅读:15 留言:0更新日期:2022-09-21 15:19
本公开提供了一种目标检测模型的训练方法、目标检测方法、装置、电子设备和介质,涉及人工智能领域,尤其涉及图像处理、计算机视觉和深度学习等技术领域,可应用于智慧城市、智能交通等场景。一种目标检测模型的训练方法,包括:获得第一样本图像和第一样本图像的真实类别;基于第一样本图像,通过第一子网络获得第一样本图像的图像特征;基于第一样本图像的图像特征,根据第二子网络获得第一样本图像的预测类别;基于第一样本图像的图像特征和真实类别的第一向量表示确定第一损失值;基于预测类别和真实类别的第二向量表示确定第二损失值;以及基于第一损失值和第二损失值调整目标检测模型的参数。检测模型的参数。检测模型的参数。

【技术实现步骤摘要】
目标检测模型训练方法、目标检测方法、装置、电子设备


[0001]本公开涉及人工智能
,尤其涉及图像处理、计算机视觉和深度学习等
,可应用于智慧城市、智能交通等场景,具体涉及一种目标检测模型的训练方法、目标检测方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]在人工智能
中,计算机视觉是其中很重要的一个方面。可以通过训练目标检测模型,使得模型获得“视觉”能力,识别图像或视频中的目标或者对目标进行分类。然而,这样的模型往往难以训练,或者准确度有限,例如,训练效果会很大地依赖于初始训练样本等。期望一种能够获得更准确的目标检测或识别能力的训练方法。

技术实现思路

[0004]本公开提供了一种目标检测模型的训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0005]根据本公开的一方面,提供了一种目标检测模型的训练方法,所述目标检测模型包括第一子网络和与所述第一子网络连接的第二子网络,所述方法包括:获得第一样本图像和所述第一样本图像的真实类别;基于所述第一样本图像,通过所述第一子网络获得所述第一样本图像的图像特征;基于所述第一样本图像的图像特征,根据所述第二子网络获得所述第一样本图像的预测类别;基于所述第一样本图像的图像特征和所述真实类别的第一向量表示确定第一损失值;基于所述预测类别和所述真实类别的第二向量表示确定第二损失值;以及基于所述第一损失值和所述第二损失值调整所述目标检测模型的参数。
[0006]根据本公开的另一方面,提供了一种目标检测模型的训练装置,所述目标检测模型包括第一子网络和与所述第一子网络连接的第二子网络,所述装置包括:真实类别获得单元,用于获得第一样本图像和所述第一样本图像的真实类别;图像特征获得单元,用于基于所述第一样本图像,通过所述第一子网络获得所述第一样本图像的图像特征;预测类别获得单元,用于基于所述第一样本图像的图像特征,根据所述第二子网络获得所述第一样本图像的预测类别;第一损失确定单元,用于基于所述第一样本图像的图像特征和所述真实类别的第一向量表示确定第一损失值;第二损失确定单元,用于基于所述预测类别和所述真实类别的第二向量表示确定第二损失值;以及参数调整单元,用于基于所述第一损失值和所述第二损失值调整所述目标检测模型的参数。
[0007]根据本公开的另一方面,提供了一种目标检测方法,包括:基于待检测图像和目标
检测模型,获得所述样本图像的预测类别,其中,所述目标检测模型是根据本公开的一个或多个实施例的目标检测模型的训练方法而获得的。
[0008]根据本公开的另一方面,提供了一种目标检测装置,包括类别预测单元,用于基于待检测图像和目标检测模型,获得所述样本图像的预测类别其中,所述目标检测模型是根据本公开的一个或多个实施例的目标检测模型的训练装置而获得的。
[0009]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据本公开的一个或多个实施例的目标检测模型的训练方法。
[0010]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开的一个或多个实施例的目标检测模型的训练方法。
[0011]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现根据本公开的一个或多个实施例的目标检测模型的训练方法。
[0012]根据本公开的一个或多个实施例,可以更加准确地训练目标检测模型。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
[0015]图1示出了根据本公开的实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;图2示出了根据本公开的实施例的目标检测模型的训练方法的流程图;图3示出了根据本公开的实施例的目标检测模型的训练方法可以适用于的模型的示意图;图4A

图4D示出了根据相关技术与本公开的实施例的方案的目标检测效果的比较示意图;图5示出了根据本公开的实施例的目标检测模型的训练装置的结构框图;图6示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
[0016]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0017]在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意
图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
[0018]在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
[0019]下面将结合附图详细描述本公开的实施例。
[0020]图1示出了根据本公开的实施例可以将本文描述的各种方法和装置在其中实施的示例性系统100的示意图。参考图1,该系统100包括一个或多个客户端设备101、102、103、104、105和106、服务器120以及将一个或多个客户端设备耦接到服务器120的一个或多个通信网络110。客户端设备101、102、103、104、105和106可以被配置为执行一个或多个应用程序。
[0021]在本公开的实施例中,服务器120可以运行使得能够执行根据本公开的目标检测模型的训练方法的一个或多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型的训练方法,所述目标检测模型包括第一子网络和与所述第一子网络连接的第二子网络,其特征在于,所述方法包括:获得第一样本图像和所述第一样本图像的真实类别;基于所述第一样本图像,通过所述第一子网络获得所述第一样本图像的图像特征;基于所述第一样本图像的图像特征,根据所述第二子网络获得所述第一样本图像的预测类别;基于所述第一样本图像的图像特征和所述真实类别的第一向量表示确定第一损失值;基于所述预测类别和所述真实类别的第二向量表示确定第二损失值;以及基于所述第一损失值和所述第二损失值调整所述目标检测模型的参数。2.根据权利要求1所述的方法,其特征在于,所述目标检测模型还包括第三子网络,所述第三子网络用于基于所述第一样本图像生成至少一个候选框,其中,基于所述图像特征和所述真实类别的第一向量表示确定第一损失值包括:基于所述第一样本图像的在所述至少一个候选框处的图像特征和所述第一向量表示确定所述第一损失值。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:确定所述至少一个候选框中的属于前景的候选部分,并且其中,基于所述第一样本图像的在所述至少一个候选框处的图像特征和所述第一向量表示确定所述第一损失值包括:基于第一图像特征和所述第一向量表示确定所述第一损失值,所述第一图像特征是所述第一样本图像中的前景候选部分处的图像特征。4.根据权利要求1

3中任一项所述的方法,其特征在于,所述第一样本图像是从第一样本图像集中获得的,所述第一样本图像集中的每个样本图像被对应标记一个类别,所述一个类别属于包括N个类别的类别集合,N为正整数,并且其中,所述真实类别的所述第一向量表示是指示所述真实类别对应所述类别集合中的一个类别的N维向量。5. 根据权利要求4所述的方法,其特征在于,所述方法还包括:获得第二样本图像集,所述第二样本图像集包括第二样本图像,所述第二样本图像被标记有第二类别,所述第二类别不属于所述N个类别;以及对所述类别集合进行更新,使得经更新的类别集合包括所述N个类别与所述第二类别。6. 根据权利要求5所述的方法,其特征在于,所述方法还包括:将所述第一向量表示更新为(N+1)维向量,使得经更新的第一向量表示指示所述真实类别对应所述经更新的类别集合中的一个类别;以及使用所述第一样本图像再次对所述目标检测模型进行训练。7.根据权利要求5所述的方法,其特征在于,所述方法还包括:通过将所述第二样本图像输入到所述第一子网络,获得所述第二样本图像的图像特征;通过将所述第二样本图像的图像特征输入到所述第二子网络,获得所述第二样本图像的预测类别;基于所述第二样本图像的图像特征和第二类别的第三向量表示确定第三损失值,其中,所述第三向量表示是指示所述第二类别对应所述经更新的类别集合中的一个类别的(N
+1)维向量;基于所述第二样本图像的预测类别和所述第二类别的第四向量表示确定第四损失值;以及基于所述第三损失值和所述第四损失值调整所述目标检测模型的参数。8.根据权利要求1

3中任一项所述的方法,其特征在于,所述真实类别的第二向量表示与所述真实类别的第一向量表示相同。9.根据权利要求1

3中任一项所述的方法,其特征在于,所述真实类别的第二向量表示是所述真实类别的类别名称的向量映射表示。10.根据权利要求1

3中任一项所述的方法,其特征在于,基于所述第一损失值和所述第二损失值调整所述目标检测模型的参数包括调整所述第一子网络和所述第二子网络的参数。11.一种目标检测方法,包括:基于待检测图像和目标检测模型,获得所述样本图像的预测类别,其特征在于,所述目标检测模型是根据权利要求1

10中任一项所述的训练方法获得的。12.一种目标检测模型的训练装置,所述目标检测模型包括第一子网络和与所述第一子网络连接的第二子网络,其特征在于,所述装置包括:真实类别获得单元,用于获得第一样本图像和所述第一样本图像的真实类别;图像特征获得单元,用于基于所述第一样本图像,通过所述第一子网络获得所述第一样本图像的图像特征;预测类别获得单元,用于基于所述第一样本图像的图像特征,根据所述第二子网络获得所述第一样本图像的预测类别;第一损失确定单元,用于基于所述第一样本图像的图像特征和所述真实类别的第一向量表示确定第一损失值;第二损失确定单元,用于基于所述预测类别和所述真实类别的第二向量表示确定第二损失...

【专利技术属性】
技术研发人员:林相如张伟谭啸
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1