一种图像中目标物的交互式标记方法技术

技术编号:31233271 阅读:37 留言:0更新日期:2021-12-08 10:11
本发明专利技术公开了一种图像中目标物的交互式标记方法。它包括如下步骤,步骤一:客户端图像数据加载;将需要标记的图像存储在服务端,并将图像以服务对外进行发布;当服务端图片被客户端请求加载时,服务端返回原始图片的压缩和第一次缩放版本;步骤二:客户端图像渲染与标记;客户端向服务端请求需要标记的图片,并在标记区域渲染缩放后的图像;客户端在标记区域内对图像中的目标物进行标记操作,形成标记结果;步骤三:标记结果坐标转换与存储;将组成客户端标记结果的点坐标转换至服务器原始图片的像素坐标,并通过调用服务端接口,将转换后的结果存储至数据库。本发明专利技术具有实现网络环境下多人协同图像标记,同时降低客户端的硬件性能要求的优点。能要求的优点。能要求的优点。

【技术实现步骤摘要】
一种图像中目标物的交互式标记方法


[0001]本专利技术涉及计算机视觉
,更具体地说它是一种图像中目标物的交互式标记方法。

技术介绍

[0002]图像标记是辅助检测图像目标物的一种预处理过程,该过程中,用户可以点击、框选或标绘图像中的特定对象,使该对象可被计算机进一步处理。图像标记工具可用来创建训练数据集,在人工智能和机器学习领域应用十分广泛。
[0003]目前,广泛使用的图像标记工具有LabelMe(http://labelme.csail.mit.edu/Release3.0)和LabelImg(https://github.com/tzutalin/labelImg)。LabelImg支持正矩形标记,标记结果默认保存为PASCAL VOC格式的xml文件。LabelMe默认支持多边形标记,同时还支持正矩形、点、线、圆的标记,标记结果默认保存为json文件。
[0004]这两类工具均需下载安装包进行本地安装,且只能打开本地图像数据,难以实现多人协同标记。同时,当图像数据量很多、单幅图像尺寸较大时,本地设备需要较大存储空间和内存,才能保证图像的流畅加载和顺利标记。
[0005]因此,开发一种实现网络环境下的多人协同图像标记、且降低大尺寸及大数量图像数据对本地设备硬件性能要求的图像标记方法很有必要。

技术实现思路

[0006]本专利技术的目的是为了提供一种图像中目标物的交互式标记方法,实现网络环境下的多人协同图像标记,同时将图像存储和压缩任务交由服务端完成,降低客户端的硬件性能要求;解决了现有图像标记工具存在的标记工具和图像数据需安装或存储在本地,难以实现多人协同标记的问题,以及当图像数据量较大时,在硬件配置低的设备上图像难以流畅加载,影响标记效率的问题。
[0007]为了实现上述目的,本专利技术的技术方案为:一种图像中目标物的交互式标记方法,其特征在于:包括如下步骤,
[0008]步骤一:客户端图像数据加载;
[0009]将需要标记的图像存储在服务端,并将图像以服务对外进行发布;采用网络化架构,将图像数据放在服务端供外界访问,标记结果存储在数据库,可实现多人协同标记;
[0010]当服务端图片被客户端请求加载时,服务端返回原始图片的压缩和第一次缩放版本;经过压缩后,数据量减小,在目标物清晰可辨的前提下,可较好的在网络上进行传输,实现多人协同标记;
[0011]步骤二:客户端图像渲染与标记;
[0012]客户端向服务端请求需要标记的图片(该图片为原始图片的压缩和第一次缩放版本),并在标记区域渲染缩放后的图像;
[0013]渲染完成后,客户端在标记区域内对图像中的目标物进行交互式标记操作,形成
标记结果;
[0014]步骤三:标记结果坐标转换与存储;
[0015]组成客户端标记结果的点坐标为标记区域内的局部相对坐标,需转换至服务器原始图片的像素坐标,
[0016]将组成客户端标记结果的点坐标转换至服务器原始图片的像素坐标,并通过调用服务端接口,将转换后的结果存储至数据库(如图1所示);通过标记结果的坐标转换,将目标物的标记结果从压缩后图像上的坐标精确反算至原始图像上的坐标,保证了标记结果的可靠性。
[0017]在上述技术方案中,在步骤二中,交互式标记操作包括交互式点击、框选或标绘等。
[0018]在上述技术方案中,在步骤二中,标记过程中,图片相对标记区域可进行平移或缩放。
[0019]在上述技术方案中,如图2所示,将组成客户端标记结果的点坐标转换至服务器原始图片的像素坐标,具体方法如下:
[0020]设原始图片第一次缩放倍数为r,在客户端标记区域内二次缩放倍数为R,二次缩放的图像左上角相对标记区域左上角的偏移为(Δx,Δy);
[0021]组成客户端标记结果的点在标记区域内的相对坐标为(X0,Y0),对应点在服务器原始图片的像素坐标(x0,y0),转换关系满足以下公式:
[0022][0023]公式(1)中,当R>1时,表示图像第二次在标记区域内缩小;当R<1时,表示图像第二次在标记区域内放大;当R=1时,表示图像第二次在标记区域内以原始比例显示。
[0024]上述服务端原始图片的压缩与缩放,在标记区域渲染缩放后的图像,通过调用服务端接口、将转换后的结果存储至数据库的方法均为现有技术。
[0025]本专利技术具有如下优点:
[0026]1)采用了网络化架构,将图像数据放在服务端供外界访问,标记结果存储在数据库,可实现多人协同标记;克服了现有技术在标记工具和图像数据需安装或存储在本地,难以实现多人协同标记的缺陷;
[0027]2)通过服务端的图像数据压缩和缩放,图像以更小的数据量和尺寸传输至客户端,有效降低了对客户端的网络带宽、存储容量和内存大小等硬件要求;克服了现有图像标记工具在图像数据量较大时,在硬件配置低的设备上图像难以流畅加载,影响标记效率的缺陷;
[0028]3)通过标记结果的坐标转换,将目标物的标记结果从压缩后图像上的坐标精确反算至原始图像上的坐标,保证了标记结果的可靠性。
附图说明
[0029]图1为本专利技术总体技术原理示意图。
[0030]图2为本专利技术中的标记结果坐标转换示意图。
[0031]图3为本专利技术实施例中实施例图像中目标物的交互式标记示意图。
[0032]图3中从左至右分别为图3(1)、图3(2)、图3(3);图3(1)为本实施例原始图片;图3(2)为本实施例原始图片经压缩与一次缩放后图片;图3(3)为本实施例二次缩放后图片及标记区域。
[0033]图3(3)中图片外圈的浅灰色底纹区域为步骤二所述的标记区域。
具体实施方式
[0034]下面结合附图详细说明本专利技术的实施情况,但它们并不构成对本专利技术的限定,仅作举例而已。同时通过说明使本专利技术的优点更加清楚和容易理解。
[0035]本技术方案提出了一种图像中目标物的交互式标记方法,该方法通过服务端图像数据压缩发布、客户端图像渲染与标记、标记结果坐标转换与存储等步骤,实现网络环境下的多人协同图像标记,同时将图像存储和压缩任务交由服务端完成,降低了客户端的硬件性能要求。
[0036]实施例
[0037]现以本专利技术试用于某图像中球形灯状目标物的交互式标记为实施例对本专利技术进行详细说明,对本专利技术应用于其它图像中目标物的交互式标记同样具有指导作用。
[0038]基于某球形灯状目标物的图像数据,采用本技术方案进行试验的效果如图3所示。
[0039]图3(1)为图像采集设备获取的原始图片数据,BMP格式,数据量为19496KB,尺寸为5472
×
3648。可见单张原始图片数据较大,数量较多时,对于传统的本地标记,需要较大的硬盘和内存才能保障数据的存放和快速读取。
[0040]图3(2)为采用jpg格式进行压缩,缩小10倍之后的图片数据,数据量为31KB,尺寸为548
...

【技术保护点】

【技术特征摘要】
1.一种图像中目标物的交互式标记方法,其特征在于:包括如下步骤,步骤一:客户端图像数据加载;将需要标记的图像存储在服务端,并将图像以服务对外进行发布;当服务端图片被客户端请求加载时,服务端返回原始图片的压缩和第一次缩放版本;步骤二:客户端图像渲染与标记;客户端向服务端请求需要标记的图片,并在标记区域渲染缩放后的图像;渲染完成后,客户端在标记区域内对图像中的目标物进行标记操作,形成标记结果;步骤三:标记结果坐标转换与存储;将组成客户端标记结果的点坐标转换至服务器原始图片的像素坐标,并通过调用服务端接口,将转换后的结果存储至数据库。2.根据权利要求1所述的图像中目标物的交互式标记方法,其特征在于:在步骤二中,标记操作包括交互式点击、框选、标绘。3.根据权利要求2所述...

【专利技术属性】
技术研发人员:罗兵徐志敏李圣田朱和平雷苏琪马能武黄祥虎陶蔚曹胜中何涛王炜曾志群尹强宏
申请(专利权)人:长江空间信息技术工程有限公司武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1