目标识别方法、目标识别模型的训练方法及装置制造方法及图纸

技术编号:34867686 阅读:29 留言:0更新日期:2022-09-08 08:13
本公开提供了一种目标识别的方法、目标识别模型的训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及人工智能领域,尤其涉及图像处理、计算机视觉和深度学习技术领域,可应用于3D视觉、虚拟现实等场景。方案为:初始化待训练的学生模型并确定经训练的教师模型;获取样本数据以及所对应的标签数据,标签数据用于标记样本数据中所对应的待识别目标所在区域的位置;将样本数据分别输入学生模型和教师模型,获得学生模型输出的第一特征图和目标识别结果、教师模型输出的第二特征图;基于第一和第二特征图和标签数据确定蒸馏损失值;基于蒸馏损失值和所确定的目标识别损失值,调节学生模型的参数值。调节学生模型的参数值。调节学生模型的参数值。

【技术实现步骤摘要】
目标识别方法、目标识别模型的训练方法及装置


[0001]本公开涉及人工智能
,尤其涉及图像处理、计算机视觉和深度学习等
,可应用于3D视觉、虚拟现实等场景,具体涉及一种目标识别方法、目标识别模型的训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]目标识别作为视觉技术的一个分支,通过对视场内的目标进行识别,对目标行为进行分析。具体地,可以通过相应传感器采集数据,并利用人工智能分析采集到的数据,从而达到目标识别和目标行为分析的目的。
[0003]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

技术实现思路

[0004]本公开提供了一种目标识别方法、目标识别模型的训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0005]根据本公开的一方面,提供了一种目标识别网络模型的训练方法,包括:初始化待训练的学生模型,所述学生模型包括第一特征提取网络和检测头网络;获取样本数据以及所述样本数据所对应的标签数据,其中所述标签数据用于标记所述样本数据中所对应的待识别目标所在区域的位置;确定经训练的教师模型,所述教师模型包括第二特征提取网络;将所述样本数据分别输入所述第一特征提取网络和第二特征提取网络,以获得第一特征图和第二特征图;基于所述第一特征图、所述第二特征图和所述标签数据,通过预设的第一损失函数确定蒸馏损失值;将所述第一特征图输入所述第一检测头网络,以获得目标识别结果;基于所述目标识别结果以及所述标签数据,通过预设的第二损失函数确定目标识别损失值;以及基于所述蒸馏损失值以及所述目标识别损失值,调节所述第一特征提取网络和所述检测头网络的参数值。
[0006]根据本公开的另一方面,提供了一种目标识别方法,包括:获取包括待识别目标的观测数据;以及将所述观测数据输入经训练的学生模型,以获得识别结果,其中,所述学生模型基于上述的方法训练得到。
[0007]根据本公开的另一方面,提供了一种目标识别网络模型的训练装置,包括:第一初始单元,初始化待训练的学生模型,所述学生模型包括第一特征提取网络和检测头网络;获取单元,获取样本数据以及所述样本数据所对应的标签数据,其中所述标签数据用于标记所述样本数据中所对应的待识别目标所在区域的位置;第二初始单元,确定经训练的教师模型,所述教师模型包括第二特征提取网络;第一提取单元,将所述样本数据分别输入所述
第一特征提取网络和第二特征提取网络,以获得第一特征图和第二特征图;第一计算单元,基于所述第一特征图、所述第二特征图和所述标签数据,通过预设的第一损失函数确定蒸馏损失值;预测单元,将所述第一特征图输入所述第一检测头网络,以获得目标识别结果;第二计算单元,基于所述目标识别结果以及所述标签数据,通过预设的第二损失函数确定目标识别损失值;以及更新单元,基于所述蒸馏损失值以及所述目标识别损失值,调节所述第一特征提取网络和所述检测头网络的参数值。
[0008]根据本公开的另一方面,提供了一种目标识别装置,包括:观测单元,获取包括待识别目标的观测数据;以及识别单元,将所述观测数据输入经训练的学生模型,以获得识别结果,其中,所述学生模型基于上述的方法训练得到。
[0009]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够执行用于目标识别的神经网络模型的训练方法以及目标识别方法。
[0010]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行用于目标识别的神经网络模型的训练方法以及目标识别方法。
[0011]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现用于目标识别的神经网络模型的训练方法以及目标识别方法。
[0012]根据本公开的一个或多个实施例,在调节学生模型的参数值时,使用样本数据所对应的标签数据限制蒸馏损失计算的区域,可以让学生模型将注意力集中到待识别目标所在区域的位置,不仅能够提高模型的训练效率,还能够提高模型的训练精度。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
[0015]图1示出了根据本公开的实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;
[0016]图2示出了根据本公开的实施例的目标识别网络模型的训练方法的流程图;
[0017]图3A

3B分别示出了根据本公开的实施例的确定第一特征图和第二特征图中的前景区域的示意图;
[0018]图4示出了根据本公开的实施例的目标识别方法的流程图;
[0019]图5示出了根据本公开的实施例的目标识别网络模型的训练装置的结构框图;
[0020]图6示出了根据本公开的实施例的目标识别装置的结构框图;以及
[0021]图7示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
[0024]在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
[0025]下面将结合附图详细描述本公开的实施例。...

【技术保护点】

【技术特征摘要】
1.一种目标识别网络模型的训练方法,包括:初始化待训练的学生模型,所述学生模型包括第一特征提取网络和检测头网络;获取样本数据以及所述样本数据所对应的标签数据,其中所述标签数据用于标记所述样本数据中所对应的待识别目标所在区域的位置;确定经训练的教师模型,所述教师模型包括第二特征提取网络;将所述样本数据分别输入所述第一特征提取网络和第二特征提取网络,以获得第一特征图和第二特征图;基于所述第一特征图、所述第二特征图和所述标签数据,通过预设的第一损失函数确定蒸馏损失值;将所述第一特征图输入所述第一检测头网络,以获得目标识别结果;基于所述目标识别结果以及所述标签数据,通过预设的第二损失函数确定目标识别损失值;以及基于所述蒸馏损失值以及所述目标识别损失值,调节所述第一特征提取网络和所述检测头网络的参数值。2.如权利要求1所述的方法,其中,基于所述第一特征图、所述第二特征图和所述标签数据确定蒸馏损失值包括:基于所述标签数据分别确定所述第一特征图和所述第二特征图中的前景区域,其中,所述前景区域对应于所述标签数据所标记的所述待识别目标所在区域;以及基于所述第一特征图和所述第二特征图中的前景区域所对应的特征值,确定所述蒸馏损失值。3.如权利要求1所述的方法,其中,基于所述第一特征图、所述第二特征图和所述标签数据确定蒸馏损失值包括:基于所述第一特征图和所述第二特征图确定蒸馏损失特征图;基于所述标签数据确定所述蒸馏损失特征图中的前景区域,以基于所述前景区域确定所述蒸馏损失值,其中,所述前景区域对应于所述标签数据所标记的所述待识别目标所在区域。4.如权利要求2所述的方法,其中,基于所述标签数据分别确定所述第一特征图和所述第二特征图中的前景区域包括:确定所述第一特征图和所述第二特征图中的每个格点与所述标签数据所对应区域的重叠面积;以及响应于确定所述重叠面积与该格点面积的比值大于预设阈值,将该格点设置为前景区域。5.如权利要求2所述的方法,其中,基于所述标签数据分别确定所述第一特征图和所述第二特征图中的前景区域包括:确定所述第一特征图和所述第二特征图中的每个格点的中心点是否位于所述标签数据所对应区域内;以及响应于确定该格点的中心点位于所述标签数据所对应区域内,将该格点设置为前景区域。6.如权利要求3所述的方法,其中,基于所述标签数据确定所述蒸馏损失特征图中的前
景区域包括:确定所述蒸馏损失特征图中的每个格点与所述标签数据所对应区域的重叠面积;以及响应于确定所述重叠面积与该格点面积的比值大于预设阈值,将该格点设置为前景区域。7.如权利要求3所述的方法,其中,基于所述标签数据确定所述蒸馏损失特征图中的前景区域包括:确定所述蒸馏损失特征图中的每个格点的中心点是否位于所述标签数据所对应区域内;以及响应于确定该格点的中心点位于所述标签数据所对应区域内,将该格点设置为前景区域。8.如权利要求1所述的方法,其中,所述样本数据包括以下项中的任意一项:点云数据、图像数据。9.一种目标识别方法,包括:获取包括待识别目标的观测数据;以及将所述观测数据输入经训练的学生模型,以获得识别结果,其中,所述学生模型基于权利要求1

8中任一项所述的方法训练得到。10.如权利要求9所述的方法,其中,通过位于观测车辆上或路侧设备上的传感器获得所述观测数据;所述目标识别方法在计算设备中实现,所述计算设备通过所述传感器获取观测数据;所述计算设备驻留在所述观测车辆上、驻留在所述路侧设备上或者驻留在云端。11.一种目标识别网络模型的训练装置,包括:第一初始单元,配置为初始化待训练的学生模型,所述学生模型包括第一特征提取网络和检测头网络;获取单元,配置为获取样本数据以及所述样本数据所对应的标签数据,其中所述标签数据用于标记所述样本数据中所对应的待识别目标所在区域的位置;第二初始单元,配置为确定经训练的教师模型,所述教师模型包括第二特征提取网络;第一...

【专利技术属性】
技术研发人员:鞠波叶晓青谭啸
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1