【技术实现步骤摘要】
一种基于深度学习的工业图像组件精准定位系统
本专利技术属于机器视觉定位领域,涉及一种基于深度学习的工业图像组件精准定位系统。
技术介绍
工业领域,机器视觉定位技术广泛应用于螺孔、器件、物件等组件的定位。比如螺钉视觉机器人精确定位螺孔的位置,将螺钉精准打进螺孔并旋拧;插件视觉机器人精确定位主板上待插元器件的位置,将元器件准确插进主板;安检视觉机器人准确定位插座的位置及角度,将插座顺利插进插座中并进行后续自动化测试;码垛视觉机器人将物体进行准确定位后,自动码垛到相应的位置等。组件定位的精度和速度不仅影响自动化的效率,更大程度影响产品的良品率;如果定位精度低,一方面没法完成高精度的自动化产品定位;另一方面,在自动化流水线运行的过程中,可能会打坏产品。目前市场上商用的机器视觉软件大多使用美国的visiopro和德国的halcon,虽然性能较好,但是单台机器的基础license费用过万,价格相对较高,而且采用的是传统的图像处理算法,配置起来相对繁杂;而传统的基于图像匹配的算法、基于角点的检测算法等,针对复杂环境以及光线变化适用性较差,精度和准确率相对较低,而且针对不同的环境需要分别调整参数;因此研发一种高精度、高可靠、高适用性的工业图像组件精准定位方法迫在眉睫,具有较高的战略意义。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于深度学习的工业图像组件精准定位系统。为达到上述目的,本专利技术提供如下技术方案:一种基于深度学习的工业图像组件精准定位系统,所述系统包括深度学习组件定位模块 ...
【技术保护点】
1.一种基于深度学习的工业图像组件精准定位系统,其特征在于:所述系统包括深度学习组件定位模块和后处理模块;/n首先通过工业相机对待定位物件进行拍照;其次,将图像送入至深度学习组件定位网络中,精确检测出组件的像素级角点;最后,通过后处理模块,可得到组件的中心点坐标、轮廓及坐标和相对旋转角度。/n
【技术特征摘要】
1.一种基于深度学习的工业图像组件精准定位系统,其特征在于:所述系统包括深度学习组件定位模块和后处理模块;
首先通过工业相机对待定位物件进行拍照;其次,将图像送入至深度学习组件定位网络中,精确检测出组件的像素级角点;最后,通过后处理模块,可得到组件的中心点坐标、轮廓及坐标和相对旋转角度。
2.根据权利要求1所述的一种基于深度学习的工业图像组件精准定位系统,其特征在于:所述深度学习组件定位模块包括轻量型卷积神经网络模块、可变形卷积神经网络模块、输出网络模块和角点解析模块;
深度学习组件定位流程分为推理过程和训练过程两个流程;为了得到组件定位模块的网络模型参数需要使用样本集对网络进行闭环训练,样本集包含训练集、验证集和测试集。
3.根据权利要求1所述的一种基于深度学习的工业图像组件精准定位系统,其特征在于:所述后处理模块包括组件中心点计算模块、组件轮廓提取模块和组件的相对旋转角度计算模块。
4.根据权利要求2所述的一种基于深度学习的工业图像组件精准定位系统,其特征在于:所述组件定位模块对应的深度学习网络是由轻量型卷积神经网络、可变形卷积神经网络、输出网络、角点解析融合而成;
通过组件定位推理流程,得到关键点的热力图和对应的图像位置偏置差;
热力图的峰值对应的就是待定位的组件关键点,将关键点的坐标与对应的图像位置偏置差融合得到待定位的组件角点位置。
5.根据权利要求4所述的一种基于深度学习的工业图像组件精准定位系统,其特征在于:所述轻量型卷积神经网络包含2个Layer,每一级Layer的输出作为下一级Layer的输入;每级Layer配置具体如下:
(1)Layer0:由Conv2d、BatchNorm2d、h_swish模块串联而成;其中Conv2d是标准的二维卷积模块、BatchNorm2d是标准的二维数据归一化处理模块、h_swish是激活函数模块;
(2)Layer1:由11级Mobileblock串联而成;其中每个Mobileblock由conv、depth_conv、squeeze_block、point_conv四个模块串联构成,每个模块的输出为下一个模块的输入;具体的配置如下:
conv:由Conv2d、BatchNorm2d、activation模块串联而成;
depth_conv:由Conv2d、BatchNorm2d模块串联而成;
squeeze_block:由avg_pool2d、Linear、ReLU、Linear、h_sigmoid模块串联构成;其中Linear为深度学习框架的标准线性化模块、avg_pool2d为深度学习框架的标准池化模块、h_sigmoid为是非线性激活函数模块;
point_conv:由Conv2d、BatchNorm2d、activation串联而成;
前6个Mobileblock的activation选用ReLU激活函数;后5个Mobileblock的activation选用h_swish激活函数。
6.根据权利要求4所述的一种基于深度学习的工业图像组件精准定位系统,其特征在于:所述可变形卷积神经网络包含3个Layer,每一级Layer的输出作为下一级Layer的输入,第一级Layer输入来源于轻量型卷积神经网络模块的输出;每级Layer配置具体如下:
(1)Layer0:由Conv2d、BatchNorm2d、ReLU、ConvTranspose2d、BatchNorm2d、ReLU串联而成;其中ConvTranspose2d为标准的二维反卷积模块;
(2)Layer1:整体网络结构同Layer0;
(3)...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。