一种高效数据标注方法技术

技术编号:23050242 阅读:36 留言:0更新日期:2020-01-07 14:48
本发明专利技术公开的属文本数据标注技术领域,具体为一种高效数据标注方法,该高效数据标注方法的具体标注步骤如下:S1:将待标注图像传输到数据标注平台上,以便标注系统进行处理和标注人员标注;S2:对图像进行投影变换,使标注目标形状接近矩形;S3:用矩形标注法进行标注;S4:坐标逆变换;S5:得到原图对应标注信息:将步骤S4中逆变换后的原始图像上相应的位置的坐标输出,在单张图像样本含有大量相同方向(形态)待标注目标(如票据样本含有大量同角度方向的文本框)的情况下,经过一次投影变换后所有目标的标注难度都将大大降低,极大地提升了标注速度;标注精度高:所得到的标注框能够很好得贴合目标,空隙小,精度高。

An efficient data annotation method

【技术实现步骤摘要】
一种高效数据标注方法
本专利技术涉及文本数据标注
,具体为一种高效数据标注方法。
技术介绍
在解决目标检测问题时,常常需要对现有图像数据进行待检测目标的位置边框标注,由于摄像头和拍摄物的角度问题,原本形状较为规则的目标在成像后往往已经发生了形变,给标注工作增加了不少难度,这种情况在OCR样本上体现的尤为明显。现有方法之一是采用矩形标注方法,即统一用矩形标注框对目标位置进行标注,该方法的优点是标注效率高,只需选取两个点(常常用鼠标点击->拖拽->松开的形式)即可完成一个目标的标注,缺点是精度不高,因为物体在发生形变后往往不能填满整个矩形框,而会留下很大的空隙。现有方法之二是用任意四边形来对物体进行标注,该方法需要选定4个点来完成每一个目标的标注,其优点是标注精度较高,在标注人员认真标注的情况下可以获得较高质量的标注数据。但缺点是标注工作强度大(需要点四个点),容易出错,实际操作时某一个点的位置稍有偏差会造成整个四边形发生较大形变,造成频繁修改。
技术实现思路
本专利技术的目的在于提供一种高效数据标注方法,以解决上述
技术介绍
中提出的缺点是精度不高,因为物体在发生形变后往往不能填满整个矩形框,而会留下很大的空隙,工作强度大,容易出错的问题。为实现上述目的,本专利技术提供如下技术方案:一种高效数据标注方法,该高效数据标注方法的具体标注步骤如下:S1:投放待标注图像:将待标注图像传输到数据标注平台上,以便标注系统进行处理和标注人员标注;S2:对图像进行投影变换,使标注目标形状接近矩形:以显示区域的左侧边和上边为Y轴和X轴建立平面直角坐标系,且Y轴和X轴的交点为原点,对步骤S1中投放的待标注图像进行投影变换处理,使得待标注图像中待标注的目标接近矩形状,将接近矩形状的待标注的目标置于视觉的中部;S3:用矩形标注法进行标注:待标注图像投影变换至水平后,能很方便的用矩形标注法对其进行标注,只要选定矩形左上和右下两个点,即可得到矩形标注框;S4:坐标逆变换:在第二步中标注所得的坐标可看作是投影变换后的坐标,利用之前求得的投影矩阵,对坐标进行逆变换,即可得到原始图像上相应的位置的坐标;S5:得到原图对应标注信息:将步骤S4中逆变换后的原始图像上相应的位置的坐标输出,即可得到原图对应标注信息。优选的,所述投影变换处理的方式包括旋转、翻转、平移和缩放等投影变换处理方式。优选的,所述旋转的投影变换处理方式拆分为三个部分,第一部分是图像中心平移至原点,第二部分是以θ角度进行旋转,第三部分是将图像中心平移回去。优选的,所述翻转的投影变换处理方式具体为:调控图像关于在显示区域中任意一条直线对折翻转。优选的,所述平移的投影变换处理方式具体为:将图像中心平移至原点,之后移动图像中心并带动图像横移和纵移,且图像横移、纵移的长度分别为显示区域横向长度一半、纵向长度一半。优选的,所述缩放的投影变换处理方式具体为:选定显示区域的中心点为缩放点,对图像按照N倍比例的缩放。与现有技术相比,本专利技术的有益效果是:1)标注省时:在单张图像样本含有大量相同方向(形态)待标注目标(如票据样本含有大量同角度方向的文本框)的情况下,经过一次投影变换后所有目标的标注难度都将大大降低,极大地提升了标注速度;2)标注精度高:所得到的标注框能够很好得贴合目标,空隙小,精度高。附图说明图1为本专利技术标注方法的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本专利技术的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。请参阅图1,本专利技术提供一种技术方案:一种高效数据标注方法,该高效数据标注方法的具体标注步骤如下:S1:投放待标注图像:将待标注图像传输到数据标注平台上,以便标注系统进行处理和标注人员标注,需要数据标注的图像通常为人工放入识别区域,通过摄像头进行采集获得需要数据标注的图像;S2:对图像进行投影变换,使标注目标形状接近矩形:以显示区域的左侧边和上边为Y轴和X轴建立平面直角坐标系,且Y轴和X轴的交点为原点,对步骤S1中投放的待标注图像进行投影变换处理,使得待标注图像中待标注的目标接近矩形状,将接近矩形状的待标注的目标置于视觉的中部,建立的坐标系覆盖整改显示区域;S3:用矩形标注法进行标注:待标注图像投影变换至水平后,能很方便的用矩形标注法对其进行标注,只要选定矩形左上和右下两个点,即可得到矩形标注框,将矩形标注框的面积覆盖整个标注目标;S4:坐标逆变换:在第二步中标注所得的坐标可看作是投影变换后的坐标,利用之前求得的投影矩阵,对坐标进行逆变换,即可得到原始图像上相应的位置的坐标;S5:得到原图对应标注信息:将步骤S4中逆变换后的原始图像上相应的位置的坐标输出,即可得到原图对应标注信息。所述投影变换处理的方式包括旋转、翻转、平移和缩放等投影变换处理方式,根据不同的使用情况选用旋转、翻转、平移和缩放单一的投影变换处理方式或者其中两个或多个的组合操作方式。所述旋转的投影变换处理方式拆分为三个部分,第一部分是图像中心平移至原点,以图像中心为基准点,带动整个图像同时移动,第二部分是以θ角度进行旋转,θ角度具体值根据具体的图像进行选择,对图像进行旋转作用,使得图像中待标注的目标能够通过旋转达到接近平直的状态,第三部分是将图像中心平移回去,使得图像的待标注的目标能够平直显示在显示区域中部。所述翻转的投影变换处理方式具体为:调控图像关于在显示区域中任意一条直线对折翻转,翻转把图像关于显示区域中任意一条直线进行翻转180°,使得图像关于该直线翻转并显示翻转后的图像信息。所述平移的投影变换处理方式具体为:将图像中心平移至原点,之后移动图像中心并带动图像横移和纵移,且图像横移、纵移的长度分别为显示区域横向长度一半、纵向长度一半,当图像显示的待标注的目标处于显示区域的边缘时,不方便看清楚或者难以识别时,将该图像调整到显示区域的中部方便进行识别的作用。所述缩放的投影变换处理方式具体为:选定显示区域的中心点为缩放点,对图像按照N倍比例的缩放,当待标注的目标相对显示区域的比例较小时,其识别不准确,且难以进行识别作用,需要进行放大操作,将图像放大,使得待标注的目标与显示区域的比例适中。实施例:以旋转平移变换举例。如下图票据样本中有一旋转文本,直接对其进行标注较为不本文档来自技高网...

【技术保护点】
1.一种高效数据标注方法,其特征在于:该高效数据标注方法的具体标注步骤如下:/nS1:投放待标注图像:将待标注图像传输到数据标注平台上,以便标注系统进行处理和标注人员标注;/nS2:对图像进行投影变换,使标注目标形状接近矩形:以显示区域的左侧边和上边为Y轴和X轴建立平面直角坐标系,且Y轴和X轴的交点为原点,对步骤S1中投放的待标注图像进行投影变换处理,使得待标注图像中待标注的目标接近矩形状,将接近矩形状的待标注的目标置于视觉的中部;/nS3:用矩形标注法进行标注:待标注图像投影变换至水平后,能很方便的用矩形标注法对其进行标注,只要选定矩形左上和右下两个点,即可得到矩形标注框;/nS4:坐标逆变换:在第二步中标注所得的坐标可看作是投影变换后的坐标,利用之前求得的投影矩阵,对坐标进行逆变换,即可得到原始图像上相应的位置的坐标;/nS5:得到原图对应标注信息:将步骤S4中逆变换后的原始图像上相应的位置的坐标输出,即可得到原图对应标注信息。/n

【技术特征摘要】
1.一种高效数据标注方法,其特征在于:该高效数据标注方法的具体标注步骤如下:
S1:投放待标注图像:将待标注图像传输到数据标注平台上,以便标注系统进行处理和标注人员标注;
S2:对图像进行投影变换,使标注目标形状接近矩形:以显示区域的左侧边和上边为Y轴和X轴建立平面直角坐标系,且Y轴和X轴的交点为原点,对步骤S1中投放的待标注图像进行投影变换处理,使得待标注图像中待标注的目标接近矩形状,将接近矩形状的待标注的目标置于视觉的中部;
S3:用矩形标注法进行标注:待标注图像投影变换至水平后,能很方便的用矩形标注法对其进行标注,只要选定矩形左上和右下两个点,即可得到矩形标注框;
S4:坐标逆变换:在第二步中标注所得的坐标可看作是投影变换后的坐标,利用之前求得的投影矩阵,对坐标进行逆变换,即可得到原始图像上相应的位置的坐标;
S5:得到原图对应标注信息:将步骤S4中逆变换后的原始图像上相应的位置的坐标输出,即可得到原图对应标注信息。


2.根据权利...

【专利技术属性】
技术研发人员:张欢李爱林周先得张仕洋
申请(专利权)人:深圳市华付信息技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1