目标检测模型生成方法、目标检测方法、设备及介质技术

技术编号:33795638 阅读:27 留言:0更新日期:2022-06-16 09:58
本公开是关于一种目标检测模型生成方法、基于机器视觉的目标检测方法、设备及介质,涉及机器视觉技术领域,可以应用于自动驾驶场景。该基于机器视觉的目标检测方法,包括:获取地面正视图像,并计算地面正视图像对应的鸟瞰图像;针对鸟瞰图像进行矩形框标注,以确定鸟瞰图像中目标对象的矩形框标注信息;根据矩形框标注信息确定地面正视图像中目标对象的多边形框标注信息,多边形框为非矩形框;获取初始模型,根据地面正视图像和多边形框标注信息对初始模型进行模型训练,以得到第一目标检测模型。本公开可以确定出道路地面中目标对象的多边形检测框的预测信息,使得确定出的目标对象的位置信息更加准确。象的位置信息更加准确。象的位置信息更加准确。

【技术实现步骤摘要】
目标检测模型生成方法、目标检测方法、设备及介质


[0001]本公开涉及机器视觉
,具体而言,涉及一种目标检测模型生成方法、基于机器视觉的目标检测方法、电子设备以及计算机可读存储介质。

技术介绍

[0002]自动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让电脑可以在没有任何人类主动的操作下,自动安全地操作机动车辆。
[0003]自动驾驶需要对道路面上的目标(例如地面印刷物)有感知能力。基于机器视觉的自动驾驶可通过车载摄像头获取道路图像,再使用基于深度学习的检测或分割方法提取道路面上的目标,用于车辆定位、导航决策等。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开的目的在于提供一种目标检测模型生成方法、基于机器视觉的目标检测方法、电子设备以及计算机可读存储介质,进而至少在一定程度上克服现有的分割算法在目标检测时耗时过长,且检测算法的检测框的框选范围过大而将地面相邻对象框选入内导致确定出的检测范围不准确的问题。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。
[0007]根据本公开的第一方面,提供一种目标检测模型生成方法,包括:获取地面正视图像,并计算地面正视图像对应的鸟瞰图像;针对鸟瞰图像进行矩形框标注,以确定鸟瞰图像中目标对象的矩形框标注信息,矩形框标注信息包括矩形框在鸟瞰图像中的像素位置和目标类别;根据矩形框标注信息确定地面正视图像中目标对象的多边形框标注信息,多边形框标注信息包括多边形框在地面正视图像中的像素位置和目标类别,所述多边形框为非矩形框;获取初始模型,根据地面正视图像和多边形框标注信息对初始模型进行模型训练,以得到第一目标检测模型。
[0008]可选的,计算地面正视图像对应的鸟瞰图像,包括:获取拍摄地面正视图像的成像设备参数,根据成像设备参数确定逆透视变换矩阵;根据逆透视变换矩阵对地面正视图像进行逆透视变换处理,以生成鸟瞰图像。
[0009]可选的,根据矩形框标注信息确定地面正视图像中目标对象的多边形框标注信息,包括:将鸟瞰图像中矩形框的像素位置进行透视变换处理,以生成地面正视图像中多边形框的像素位置。
[0010]可选的,根据地面正视图像和多边形框标注信息对初始模型进行模型训练,包括:根据地面正视图像和多边形框标注信息,通过损失函数驱动初始模型进行模型训练,其中,损失函数包括多边形轮廓匹配函数。
[0011]根据本公开的第二方面,提供一种目标检测模型生成方法,包括:获取地面正视图像,并计算地面正视图像对应的鸟瞰图像;针对鸟瞰图像进行多边形框标注,以确定鸟瞰图像中目标对象的第一多边形框标注信息,鸟瞰图像的第一多边形框标注信息包括第一多边形框在鸟瞰图像中的像素位置和目标类别,所述第一多边形框为非矩形框;根据鸟瞰图像的第一多边形框标注信息确定地面正视图像的第二多边形框标注信息,地面正视图像的第二多边形框标注信息包括第二多边形框在地面正视图像中的像素位置和目标类别;获取初始模型,根据地面正视图像和第二多边形框标注信息对初始模型进行模型训练,以得到第二目标检测模型。
[0012]可选的,计算地面正视图像对应的鸟瞰图像,包括:获取拍摄地面正视图像的成像设备参数,根据成像设备参数确定逆透视变换矩阵;以及根据逆透视变换矩阵对地面正视图像进行逆透视变换处理,以生成鸟瞰图像。
[0013]可选的,根据鸟瞰图像的第一多边形框标注信息确定地面正视图像的第二多边形框标注信息,包括:将鸟瞰图像中第一多边形框的像素位置进行透视变换处理,以生成地面正视图像中第二多边形框的像素位置。
[0014]可选的,根据地面正视图像和第二多边形框标注信息进行模型训练,包括:根据地面正视图像和第二多边形框标注信息,通过损失函数驱动初始模型进行模型训练,其中,损失函数包括多边形轮廓匹配函数。
[0015]根据本公开的第三方面,提供一种基于机器视觉的目标检测方法,包括:获取目标地面正视图像;将目标地面正视图像输入至目标检测模型,由目标检测模型输出目标地面正视图像中目标对象对应的多边形检测框预测信息,多边形检测框为非矩形检测框。
[0016]根据本公开的第四方面,提供一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现根据上述任意一项所述的目标检测模型生成方法或基于机器视觉的目标检测方法。
[0017]根据本公开的第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据上述任意一项所述的目标检测模型生成方法或基于机器视觉的目标检测方法。
[0018]本公开提供的技术方案可以包括以下有益效果:
[0019]本公开的示例性实施例中的目标检测模型生成方法,获取地面正视图像,并计算地面正视图像对应的鸟瞰图像;针对鸟瞰图像进行矩形框标注,以确定鸟瞰图像中目标对象的矩形框标注信息,矩形框标注信息包括矩形框在鸟瞰图像中的像素位置和目标类别;根据矩形框标注信息确定地面正视图像中目标对象的多边形框标注信息,多边形框标注信息包括多边形框在地面正视图像中的像素位置和目标类别,多边形框为非矩形框;获取初始模型,根据地面正视图像和多边形框标注信息对初始模型进行模型训练,以得到第一目标检测模型。通过本公开的目标检测模型生成方法,一方面,将透视失真的学习过程引入数据标注过程,可以解决人工标注无法模拟透视失真,且不具有唯一性的问题。另一方面,采用上述方法得到的目标检测模型输出的检测结果可以避免地面上的相邻对象出现在同一检测框内,进一步提升预测结果的准确性。
[0020]采用本公开的基于机器视觉的目标检测方法,一方面,采用多边形框预测结果替代矩形框预测结果,与分割方案相比,具有检测算法速度快,输出数据量小的优势。另一方
面,将透视失真的学习过程引入数据标注过程,可以减少目标检测过程中对成像设备参数的依赖,避免在目标检测过程中引入透视变换的耗时。
[0021]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0022]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0023]图1示意性示出了现有技术中采用矩形框标注确定目标对象的得到的检测结果图;
[0024]图2示意性示出了根据本公开的示例性实施方式的第一目标检测模型生成方法的流程图;
[0025]图3示意性示出了根据本公开的示例性实施方式的对地面正视图像进行逆透视变换处理后生成的鸟瞰图像;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型生成方法,其特征在于,包括:获取地面正视图像,并计算所述地面正视图像对应的鸟瞰图像;针对所述鸟瞰图像进行矩形框标注,以确定所述鸟瞰图像中目标对象的矩形框标注信息,所述矩形框标注信息包括所述矩形框在所述鸟瞰图像中的像素位置和目标类别;根据所述矩形框标注信息确定所述地面正视图像中所述目标对象的多边形框标注信息,所述多边形框标注信息包括所述多边形框在所述地面正视图像中的像素位置和目标类别,所述多边形框为非矩形框;获取初始模型,根据所述地面正视图像和所述多边形框标注信息对所述初始模型进行模型训练,以得到第一目标检测模型。2.根据权利要求1所述的方法,其特征在于,所述计算所述地面正视图像对应的鸟瞰图像,包括:获取拍摄所述地面正视图像的成像设备参数,根据所述成像设备参数确定逆透视变换矩阵;根据所述逆透视变换矩阵对所述地面正视图像进行逆透视变换处理,以生成所述鸟瞰图像。3.根据权利要求2所述的方法,其特征在于,所述根据所述矩形框标注信息确定所述地面正视图像中所述目标对象的多边形框标注信息,包括:将所述鸟瞰图像中矩形框的像素位置进行透视变换处理,以生成所述地面正视图像中多边形框的像素位置。4.根据权利要求1所述的方法,其特征在于,所述根据所述地面正视图像和所述多边形框标注信息对所述初始模型进行模型训练,包括:根据所述地面正视图像和所述多边形框标注信息,通过损失函数驱动所述初始模型进行模型训练,其中,所述损失函数包括多边形轮廓匹配函数。5.一种目标检测模型生成方法,其特征在于,包括:获取地面正视图像,并计算所述地面正视图像对应的鸟瞰图像;针对所述鸟瞰图像进行多边形框标注,以确定所述鸟瞰图像中目标对象的第一多边形框标注信息,所述鸟瞰图像的第一多边形框标注信息包括所述第一多边形框在所述鸟瞰图像中的像素位置和目标类别,所述第一多边形框为非矩形框;根据所述鸟瞰图像的第一多边形框标注信息确定所述地面正视图像的第二多边形框标注信息,所述地面正视图...

【专利技术属性】
技术研发人员:赵一欣
申请(专利权)人:千寻位置网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1