工业俯视场景的目标零部件检测方法和装置制造方法及图纸

技术编号：40843861 阅读：6 留言：0更新日期：2024-04-01 15:11

本申请公开了一种工业俯视场景的目标零部件检测方法和装置，目标定位模型的训练方法和装置，以及电子设备和计算机存储介质，属于机器视觉检测技术领域。其中，工业俯视场景的目标零部件检测方法，包括：获取待检测的目标零部件图像；基于特征提取网络模型对目标零部件图像进行图像特征提取，以获得目标零部件图像的图像特征信息；将目标零部件的图像特征信息输入到预训练的目标定位模型中，以得到目标零部件的预测目标框和目标零部件的预测角度，预测角度为0°到360°区间内的任意角度。本申请实施例提供的技术方案，能够满足工业场景下对角度信息的需求。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于机器视觉检测，尤其涉及一种工业俯视场景的目标零部件检测方法和装置，目标定位模型的训练方法和装置，以及电子设备和计算机存储介质。

技术介绍

1、随着人工智能技术的迅速发展，其中工业场景中的应用越来越广泛，在工业场景中对目标零部件的定位任务有着高精度的要求。然而，在工业场景的生产线上，通常是由设置在上方的相机俯视角度进行拍摄，导致目标零部件在任意位置呈现任意角度分布特点。在这种工业俯视场景下，准确获取目标零部件的角度信息是实现对其进行高精度定位以及自动转正的前提条件，现有技术中所提供的基于人工智能技术的检测方案，均无法满足工业场景下对角度信息的需求。

技术实现思路

1、本申请旨在至少解决现有技术中存在的技术问题之一。为此，本申请提出一种工业俯视场景的目标零部件检测方法和装置，目标定位模型的训练方法和装置，以及电子设备和计算机存储介质，能够满足工业场景下对角度信息的需求。

2、第一方面，本申请提供了工业俯视场景的目标零部件检测方法，包括：

3、获取待检测的目标零部件图像；

4、基于特征提取网络模型对目标零部件图像进行图像特征提取，以获得目标零部件图像的图像特征信息；

5、将目标零部件的图像特征信息输入到预训练的目标定位模型中，以得到目标零部件的预测目标框和目标零部件的预测角度，预测角度为0°到360°区间内的任意角度。

6、在一些实施例中，还包括：

7、根据目标零部件的预测目标框和目标零部件的预测角度，通过

8、在一些实施例中，目标定位模型包括目标框预测网络和角度预测网络，目标框预测网络基于目标零部件图像的图像特征信息得到目标零部件的预测目标框，角度预测网络基于目标零部件图像的图像特征信息得到所述目标零部件的预测角度。

9、在一些实施例中，目标定位模型包括目标框检测头和角度检测头，目标框检测头用于基于目标零部件图像的图像特征信息得到目标零部件的预测目标框，角度检测头基于目标零部件图像的图像特征信息得到目标零部件的预测角度，预测角度为0°到360°区间内的任意角度。在一些实施例中，上述目标框检测头包括输出通道数目为4的卷积核，用于分别输出预测目标框的二维中心位置坐标，以及预测目标框的宽度和高度，角度检测头包括输出通道数目为1的卷积核，用于输出预测角度。

10、第二方面，本申请提供了一种工业俯视场景的目标零部件检测装置，包括：

11、获取零部件样本图像，所述零部件样本图像包括标注目标框和标注角度；

12、基于特征提取网络模型对零部件样本图像进行图像特征提取，以获得所述零部件样本图像的图像特征信息；

13、将所述零部件样本图像的图像特征信息输入到目标定位模型中进行训练，得到所述目标定位模型输出的预测目标框和预测角度；

14、基于所述目标定位模型输出的预测目标框和预测角度，以及标注目标框和标注角度计算旋转框交并比数值；

15、基于所述旋转框交并比数值，以及所述预测角度和所述标注角度的差值，通过余弦函数进行映射，得到余弦函数映射结果；

16、根据所述余弦函数映射结果对所述目标定位模型的模型参数进行调整。

17、在一些实施例中，基于旋转框交并比数值，以及目标定位模型输出的目标定位模型预测角度和标注角度的差值，通过余弦函数进行映射，得到余弦函数映射结果，包括：

18、获取所述目标定位模型中输出的预测角度和所述标注角度之差δa；

19、根据所述旋转框交并比数值iou，以及所述预测角度和标注角度之差δa，计算得到余弦函数映射结果：

20、

21、在一些实施例中，还包括：

22、基于目标定位模型输出的预测角度，以及标注角度获取角度l1损失值；

23、根据角度l1损失值调整目标定位模型的模型参数。

24、在一些实施例中，还包括：

25、基于零部件样本图像进行随机旋转，以得到具有不同标注角度的增强零部件样本图像；

26、基于特征提取网络模型对零部件样本图像进行图像特征提取，以获得零部件样本图像的图像特征信息，包括：

27、基于特征提取网络模型对零部件样本图像和具有不同标注角度的增强零部件样本图像进行图像特征提取，以获得零部件样本图像和具有不同标注角度的增强零部件样本图像的图像特征信息；

28、将所述零部件样本图像的图像特征信息输入到目标定位模型中进行训练，包括：

29、将零部件样本图像和具有不同标注角度的增强零部件样本图像的图像特征信息输入到目标定位模型中进行训练。

30、在一些实施例中，还包括：

31、确定零部件样本图像中的目标零部件为中心对称结构，则限制零部件样本图像，以及基于零部件样本图像进行随机旋转得到的增强零部件样本图像的标注角度均在0°到180°之间。第三方面，本申请实施例提供了一种工业俯视场景的目标零部件检测装置，包括：

32、图像获取模块，用于获取待检测的目标零部件图像；

33、第一特征提取模块，用于基于特征提取网络模型对所述目标零部件图像进行图像特征提取，以获得所述目标零部件图像的图像特征信息；

34、定位模块，用于将所述目标零部件的图像特征信息输入到预训练的目标定位模型中，以得到所述目标零部件的预测目标框和所述目标零部件的预测角度，所述预测角度为0°到360°区间内的任意角度。

35、第四方面，本申请实施例提供了一种目标定位模型的训练装置，包括：

36、样本图像获取模块，用于获取零部件样本图像，所述零部件样本图像包括标注目标框和标注角度；

37、第二特征提取模块，用于基于特征提取网络模型对所述零部件样本图像进行图像特征提取，以获得所述零部件样本图像的图像特征信息；

38、训练模块，用于将所述零部件样本图像的图像特征信息输入到目标定位模型进行训练，得到所述目标定位模型输出的预测目标框和预测角度；

39、交并比计算模块，用于基于所述目标定位模型输出的预测目标框和预测角度，以及标注目标框和标注角度计算旋转框交并比数值；

40、映射模块，用于基于所述旋转框交并比数值，以及所述预测角度和所述标注角度的差值，通过余弦函数进行映射，得到余弦函数映射结果；

41、第一调整模块，用于根据余弦函数映射结果对所述目标定位模型的模型参数进行调整。

42、第五方面，本申请提供了一种电子设备，包括处理器和存储器，该处理器用于执行所述存储器中的计算机程序，所述计算机程序能够执行上述的工业俯视场景的目标零部件检测方法或者目标定位模型的训练方法。

43、第六方面，本申请提供了一种计算机存储介质，用于存储计算机程序，该计算机程序能够执行上述的工业俯视场景的目标零部件检测方法或者目标定位模型的训练本文档来自技高网...

【技术保护点】

1.一种工业俯视场景的目标零部件检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，还包括：

3.根据权利要求2所述的方法，其特征在于，所述目标定位模型包括目标框检测头和角度检测头，所述目标框检测头用于基于所述目标零部件图像的图像特征信息得到所述目标零部件的预测目标框，所述角度检测头基于所述目标零部件图像的图像特征信息得到所述目标零部件的预测角度，所述预测角度为0°到360°区间内的任意角度。

4.根据权利要求3所述的方法，其特征在于，所述目标框检测头包括输出通道数目为4的卷积核，用于分别输出所述预测目标框的二维中心位置坐标，以及所述预测目标框的宽度和高度，所述角度检测头包括输出通道数目为1的卷积核，用于输出预测角度。

5.一种目标定位模型的训练方法，其特征在于，包括：

6.根据权利要求5所述的方法，其特征在于，所述基于旋转框交并比数值，以及所述目标定位模型输出的预测角度和所述标注角度的差值，通过余弦函数进行映射，得到余弦函数映射结果，包括：

7.根据权利要求5所述的方法，其特征在于，还包括：

8.根据权利要求5所述的方法，其特征在于，还包括：

9.根据权利要求8所述的方法，其特征在于，还包括：

10.一种工业俯视场景的目标零部件检测装置，其特征在于，包括：

11.一种目标定位模型的训练装置，其特征在于，包括：

...

【技术特征摘要】

1.一种工业俯视场景的目标零部件检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，还包括：

4.根据权利要求3所述的方法，其特征在于，所述目标框检测头包括输出通道数目为4的卷积核，用于分别输出所述预测目标框的二维中心位置坐标，以及所述预测目标框的宽度和高度，所述角度检测头...

【专利技术属性】
技术研发人员：刘添华，唐永亮，高鹏程，刘梦舒，
申请(专利权)人：深圳市凌云视迅科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人