一种多色球形目标检测定位方法及执行该方法的存储介质技术

技术编号:20004806 阅读:20 留言:0更新日期:2019-01-05 17:35
本发明专利技术公开了一种多色球形目标检测定位方法,通过对摄像设备拍摄到的单张图像依次进行预处理、距离变换、聚类定位以及分类几个部分的步骤,将每一个聚类结果中点簇的中心以及点簇均值所代表的颜色作为目标输出,实现对单张图像中密集多目标的定位。其有益效果为:通过距离变换获取球心的初始定位后,利用聚类方法定位各球体,根据定位结果进行颜色识别,解决了深色背景下单层排布球形目标位置与颜色的检测问题,以及检测定位问题中目标密集以及高精确度的难点;通过预处理部分的灰度化,将三通道合成的暗通道处理,更有效的进行前景与背景的分离;对圆度较差的目标具有鲁棒性、精确性的特点。能够应用于产品分拣等场景。

A Method for Detecting and Locating Polychromatic Spherical Targets and the Storage Media for Implementing the Method

The invention discloses a method for detecting and locating multi-color spherical objects. Through the steps of pre-processing, distance transformation, clustering and classification of a single image captured by a camera, the center of a point cluster and the color represented by the mean value of a point cluster in each clustering result are taken as the output of the target to realize the location of dense Multi-targets in a single image. The beneficial effects are as follows: after obtaining the initial positioning of the sphere center by distance transformation, the spheres are located by clustering method, and the color recognition is carried out according to the positioning results, which solves the problem of detecting the position and color of single-layered spherical objects in dark background, as well as the difficulty of dense and high accuracy in the detection and positioning problem; by graying the pretreatment part, the three channels are combined. The resulting dark channel processing can effectively separate the foreground from the background, and has the characteristics of robustness and accuracy for the target with poor roundness. It can be applied to product sorting and other scenarios.

【技术实现步骤摘要】
一种多色球形目标检测定位方法及执行该方法的存储介质
本专利技术涉及图像处理
,尤其涉及一种深色背景下的单层排布多色球形目标检测定位方法,以及涉及一种可执行该方法的存储介质。
技术介绍
主动视觉最早于20世纪80年代被提出,其核心思想是通过算法控制改变相机的参数以实现视觉系统的主动化。早期的主动视觉系统于20世纪90年代被陆续提出,随着软硬件技术的不断发展,主动视觉系统方面的研究也在不断继续。大多数主动视觉系统被运用于机器人,驾驶辅助以及目标跟踪中。在现有的目标检测定位算法主要有:(1)基于颜色的方法——通过训练对目标区域的像素点颜色进行建模,采用获得的模型对图像进行二值化,并通过连通区域检测方法提取出目标。基于颜色的方法可以实现目标检测定位,能够在背景较为简单的场景准确定位出目标,但该方法受背景噪声及光照变化影响较大,且在同色目标相互贴近的情况下会完全失效。(2)霍夫变换法——通过将图像平面上的点坐标代入圆方程后,在参数平面上通过统计确定各个圆的参数值,从而求得原图像平面中圆的位置与大小。霍夫变换法能对简单且标准的轮廓的目标进行准确定位,但对公差较大、数量密集的目标定位检测效果较差。(3)级联分类器——在检测图像时,对于每个窗口用多个强分类器作检测。若对某个窗口检测结果全部为真,则该窗口为被检测目标;若对某个窗口任一分类器检测结果为假,则该窗口不含检测目标。窗口的选择为先行后列作平移,检测完毕后再放大窗口进行平移,最终得到图中符合所有强分类器的目标结果。级联分类器能对目标相对较好地做出检测定位,但由于其算法中窗口平移的单位较大、且窗口尺寸放大倍率固定,难以实现像素级的检测定位。(4)模板匹配算法——指在图像中搜索与已知目标模板匹配度最高的区域的方法。首先建立目标的图像模板,在图像指定的搜索区域内寻找与该模板匹配度最高的区域,通常采用图像间的相关函数来反应匹配程度。模板匹配算法可以在较复杂背景下精确定位目标,但其时间效率较低,且在目标密集时需要依靠前置步骤进行前景分割。综上,以上这些方法虽各有优势,但难以运用在类似单层排布的多目标高精度检测定位主动视觉的场景中。因此,本领域的技术人员致力于开发一种能够在深色背景下精确检测并定位球形目标,并能判断出各球颜色的定位方法。
技术实现思路
有鉴于现有技术的上述缺陷,本专利技术所要解决的技术问题是深色背景下对彩色球形目标难以进行精确检测、定位与分类。为了解决上述问题,本专利技术提供了一种多色球形目标检测定位方法,通过对摄像设备拍摄到的单张图像依次进行预处理、距离变换、聚类定位以及分类几个部分的步骤,将每一个聚类结果中点簇的中心以及点簇均值所代表的颜色作为目标输出,实现对单张图像中密集多目标的定位。所述定位方法具体包括如下部分:第一部分,图像获取,通过摄像设备获取深色背景下的单层排布多色球形目标的图像信息;第二部分,预处理,该部分主要实现对目标可能存在的区域的计算;对任意单张图像进行灰度化处理,对灰度化后的图像利用最大类间方差法进行前景与背景的分离,再用开运算去除噪声,生成二值化图像,并确定图像的坐标;上述可能存在的区域是指图像中深色背景以外的区域;第三部分,距离变换,该部分主要实现对各前景点到背景最短距离的计算;对预处理后生成的二值化图像进行距离变换并进行归一化;对归一化图像进行阈值计算取值较大部分,从而断开二值图中球间连接,确定球的个数并获得各球心大致位置;第四部分,聚类,该部分以第三部分距离变换的球心位置为聚类种子,以球心个数为聚类类数对第一部分预处理的二值图进行K-means聚类,获得各球具体位置;第五部分,分类,该部分以第四部分聚类的各聚类结果分别为ROI(regionofinterest),对原图各ROI内的像素取均值并利用支持向量机进行分类,从而确定各球的颜色。进一步地,在分类部分,首次使用支持向量机时,需对各ROI内均值所代表颜色进行标定,以此训练支持向量机参数。本专利技术还提供一种计算机可读存储介质,其中存储有程序,该程序被执行时可执行上述深色背景下的单层排布多色球形目标检测定位方法。通过实施上述本专利技术提供的深色背景下的单层排布多色球形目标检测定位方法,具有如下技术效果:(1)本专利技术通过距离变换获取球心的初始定位后,利用聚类方法定位各球体,根据定位结果进行颜色识别,解决了深色背景下单层排布球形目标位置与颜色的检测问题,克服了单层目标检测定位问题中目标密集以及高精确度(精确到1像素)的难点;(2)本专利技术所述的实现方法通过预处理部分的灰度化,将三通道合成的暗通道处理,更有效的进行前景与背景的分离;(3)本专利技术所述的实现方法具有较好的鲁棒性,能够实现在深色背景下单层排布多色球形目标的检测定位;(4)本专利技术所述的实现方法具有较高的精确性,能够实现像素级精度目标的检测定位;(5)本专利技术所述的实现方法对圆度较差的目标具有鲁棒性、精确性的特点。能够应用于产品分拣等场景.附图说明以下将结合附图对本专利技术的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本专利技术的目的、特征和效果。图1是本专利技术实施例中摄像设备拍摄的单层排布多色球图片;图2是本专利技术实施例中预处理部分的效果图;图3是本专利技术实施例中距离变换部分的效果图;图4是本专利技术实施例中聚类部分的效果图;图5是本专利技术实施例中分类部分的效果图。具体实施方式下面将结合本专利技术实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。下面以机器人抓取目标乒乓球为实施例,详细描述本专利技术的技术方案。在机器人程序中设定某一颜色的乒乓球为抓取目标,对该颜色的乒乓球所在的抓取区域进行目标球的定位,进行如下操作:第一部分,图像获取,如图1所示通过摄像设备,例如相机,获取深色背景下的单层排布多色乒乓球的图像信息,其中乒乓球大小一致;第二部分,预处理,该部分主要实现对目标可能存在的区域的计算;对第一部分获取的单张图像进行灰度化处理,对灰度化后的图像利用最大类间方差法进行前景与背景的分离,再用开运算去除噪声,生成如图2所示的二值化图像,并确定图像的坐标;上述可能存在的区域是指图像中深色背景以外的区域;第三部分,距离变换,该部分主要实现对各前景点到背景最短距离的计算;对预处理后生成的二值化图像进行距离变换并进行归一化;对归一化图像进行阈值计算取值较大部分,从而断开二值图中球间连接,确定球的个数并获得各球心大致位置,如图3所示;第四部分,聚类,该部分以第三部分距离变换的球心位置为聚类种子,以球心个数为聚类类数,根据各点与各球心的位置距离,对第一部分预处理的二值图进行K-means聚类,获得各球具体位置;第五部分,分类,该部分以第四部分聚类的各聚类结果分别为ROI(regionofinterest),对原图各ROI内的像素取均值并利用支持向量机进行分类,从而确定各球的颜色。进一步地,在分类部分,首次使用支持向量机时,需人工对各ROI内均值所代表颜色进行标定,以此训练支持向量机参数。通过上述操作获取目标颜色乒乓球的位置信息后,位置信息输送到机器人执行抓取的程序中,机器人根据本文档来自技高网
...

【技术保护点】
1.一种多色球形目标检测定位方法,其特征在于,所述定位方法具体包括如下部分:第一部分,图像获取,通过摄像设备获取深色背景下的单层排布多色球形目标的图像信息;第二部分,预处理,该部分实现对目标可能存在的区域的计算;对任意单张图像进行灰度化处理,分离前景与背景,生成二值化图像,并确定图像坐标;上述可能存在的区域是指图像中深色背景以外的区域;第三部分,距离变换,该部分实现对各前景点到背景最短距离的计算;对预处理后生成的二值化图像进行距离变换并进行归一化,确定球的个数并获得各球心大致位置;第四部分,聚类,该部分以第三部分距离变换的球心位置为聚类种子,以球心个数为聚类类数对第一部分预处理的二值图进行K‑means聚类,获得各球具体位置;第五部分,分类,该部分以第四部分聚类的各聚类结果分别为ROI,对原图各ROI内的像素取均值并利用支持向量机进行分类,从而确定各球的颜色。

【技术特征摘要】
1.一种多色球形目标检测定位方法,其特征在于,所述定位方法具体包括如下部分:第一部分,图像获取,通过摄像设备获取深色背景下的单层排布多色球形目标的图像信息;第二部分,预处理,该部分实现对目标可能存在的区域的计算;对任意单张图像进行灰度化处理,分离前景与背景,生成二值化图像,并确定图像坐标;上述可能存在的区域是指图像中深色背景以外的区域;第三部分,距离变换,该部分实现对各前景点到背景最短距离的计算;对预处理后生成的二值化图像进行距离变换并进行归一化,确定球的个数并获得各球心大致位置;第四部分,聚类,该部分以第三部分距离变换的球心位置为聚类种子,以球心个数为聚类类数对第一部分预处理的二值图进行K-means聚类,获得各球具体位置;第五部分,分类,该部分以第四部分聚类的各聚类结果分别为ROI,...

【专利技术属性】
技术研发人员:吕燕
申请(专利权)人:上海电气集团股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1