一种基于无标牌定位的视觉定位装置及方法制造方法及图纸

技术编号:28222927 阅读:26 留言:0更新日期:2021-04-28 09:50
本发明专利技术提供了一种基于无标牌定位的视觉定位装置及方法。该装置包括云台相机和视觉服务器,云台相机采集被测物体的图像信息,然后将图像信息传输至视觉服务器中进行处理。首先将需要定位的目标物体进行分类标注,制作yolov3模型训练所需的数据集;然后训练模型,并根据待测样本定位的置信度二次确认定位结果,输出最终位置坐标及类别并保存到视觉服务器中。本发明专利技术无需依赖标牌,避免了因标牌掉落、掉漆、被遮挡而导致的定位失败、耗费人力等问题。题。题。

【技术实现步骤摘要】
一种基于无标牌定位的视觉定位装置及方法


[0001]本专利技术属于机器人视觉定位领域,具体说是一种基于无标牌定位的视觉定位装置及方法。

技术介绍

[0002]在特种机器人、工业机器人及服务型等机器人的应用中,图像识别是不可或缺的功能之一。在图像识别中,首先要解决的是对待测目标进行定位。目前大多采取根据标牌坐标对目标进行定位,但标牌的掉落、掉漆、被其它物体覆盖等都会对目标定位识别产生影响,且标牌维护需要耗费不必要的人力和时间。传统的目标定位算法无法灵活应用于复杂场景,在图像成像质量较差和拍摄角度不佳等情况下,难以实现精准定位。

技术实现思路

[0003]为解决上述技术问题,本专利技术将传统图像识别算法和深度学习算法相结合,提出了一种基于无标牌定位的视觉定位装置及方法,该方法可用于复杂场景的目标定位,解决了传统方法目标单一、抗干扰能力差的问题;同时,避免了依赖标牌、因标牌掉落、被遮挡等情况而造成定位失败。
[0004]本专利技术采用的技术方案为:一种基于无标牌定位的视觉定位装置,该装置包括:云台相机和视觉服务器。云台相机与视觉服务器通过TCP/IP协议进行信息传输。云台相机用来采集被测物体的图像信息,然后将图像信息传送到视觉服务器中进行图像处理,通过本专利技术的定位方法对待测目标进行定位。
[0005]基于上述基于无标牌定位的视觉定位装置,提出了一种基于无标牌定位的视觉定位方法,该方法将传统图像识别算法与深度学习算法相结合,首先通过图像识别算法对视觉服务器中的图像进行预处理,扩展图像边界;然后分类标注图片样本集,并以此作为输入,训练yolov3模型,并根据待测样本定位的置信度二次确认定位结果,并输出最终位置坐标及类别;最后将图像中待测物体的位置信息和类别传送给图像识别程序,完成待测目标的识别。
[0006]所述预处理主要包括滤波、边界扩展等操作,通过预处理获取训练模型所需的输入样本,使其满足模型yolov3中的输出维度batch_size长宽比,减少噪声、图像大小对后续定位结果的影响。
[0007]与现有标牌定位方法相比,本专利技术具有以下有益效果:1)与传统图像识别定位技术相比,本专利技术可以应用于复杂场景,解决了目标单一、背景单一的问题,避免了重复开发;2)与标牌定位技术相比,本专利技术无需依赖标牌,避免了因标牌掉落、掉漆、被遮挡而导致定位失败、耗费人力等问题;3)本专利技术不受复杂背景干扰,鲁棒性强,可移植性高。
附图说明
[0008]图1为本专利技术整体算法流程图。
[0009]图2为本专利技术定位结果图。
具体实施方式
[0010]下面结合附图和实施例对本专利技术做进一步详细说明;一种基于无标牌定位的视觉定位装置,该装置包括:云台相机和视觉服务器。云台相机与视觉服务器通过TCP/IP协议进行信息传输。云台相机用来采集被测物体的图像信息,然后将图像信息传送到视觉服务器中进行图像处理,通过本专利技术的定位方法对待测目标进行定位。
[0011]基于上述基于无标牌定位的视觉定位装置,提出了一种基于无标牌定位的视觉定位方法,如图1所示,该方法将传统图像识别算法与深度学习算法相结合,具体过程包括以下步骤:步骤一:收集定位点的历史图像,以这些历史图像作为原始素材,对其进行预处理,扩展图像边界,使其满足模型yolov3中的输出维度batch_size长宽比;其中,是扩展之后的图像像素值;比较图像的长和宽,若>,则将宽的大小设为与长度一样,其像素值设为0,反之亦然;原图像的像素值保持不变。
[0012]步骤二:对预处理后的图像样本集进行分类标注,得到标注类型及标注框boundbox,boundbox的坐标为,其中为左上角坐标,为右下角坐标;将boundbox坐标转换为,为检测目标中心点坐标,为目标的高和宽度。按比例将样本集划分为训练集和测试集。
[0013]步骤三:通过k

means聚类算法获得416*416图像的anchor box尺寸大小,并修改相应参数。将训练集的图像作为输入训练yolov3模型,当模型的损失函数趋于收敛时,开始边训练边测试,以测试集上准确率最高的权重参数文件作为最终的分类模型。
[0014]步骤四:利用云台相机采集需要定位的视频图像,并将图像传输到视觉服务器中,处理获取k张待测图像dst,并对其进行步骤一中的预处理。
[0015]步骤五:分别将k张待测图像dst作为输入,利用步骤三获取的权重文件作为分类模型进行预测,初步判断每一张待测图像是否定位成功。
[0016]步骤六:综合k张待测图定位的置信度,二次确认定位结果,并输出最终坐标位置及类别,其中为定位框左上角坐标,为框的宽度和高度,c为类别。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于无标牌定位的视觉定位装置,其特征在于:该装置包括云台相机和视觉服务器,不需要定制大量的定位标牌;云台相机与视觉服务器通过TCP/IP协议进行信息传输,云台相机采集图像,通过图像处理与深度学习算法相结合,进行无标牌定位,并将得到的位置信息与类别保存到视觉服务器中。2.一种基于权利要求1所述基于无标牌定位的视觉定位装置的定位方法,其特征在于:该方法包括以下步骤:步骤一:收集定位点的历史图像,以这些历史图像作为原始素材,对其进行预处理,扩展图像边界,使其满足模型yolov3中的输出维度batch_size长宽比;其中,是扩展之后的图像像素值;比较图像的长和宽,若>,则将宽的大小设为与长度一样,其像素值设为0,反之亦然;原图像的像素值保持不变;步骤二:对预处理后的图像样本集进行分类标注,得到标注类型及标注框boundbox,boundbox的坐标为,其中为左上角坐标...

【专利技术属性】
技术研发人员:裴文良杨帆陈林坤严海鹏申龙张彩江熊文莉谢海峰
申请(专利权)人:中信重工开诚智能装备有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1