一种基于人机交互的半自动标注方法及系统技术方案

技术编号：28873191 阅读：83 留言：0更新日期：2021-06-15 23:06

本发明专利技术公开了一种基于人机交互的半自动标注方法及系统，所述方法包括：将待标注的RGB图像与产生的第一高斯热图进行融合；对融合图像进行预处理；将预处理后的融合图像输入预先建立和训练好的半自动标注模型，对待标注RGB图像标注多个预测框；当有预测框不满足要求，则通过产生第二高斯热图对不满足要求的预测框进行修正。本发明专利技术的方法将高斯热图作为先验信息来对目标进行检测，进而达到半自动标注的预期效果；可以摆脱人工标注费时费力的弊端，并提高标注的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于人机交互的半自动标注方法及系统
本专利技术属于目标检测领域，具体涉及一种利用额外的点击作为先验信息，通过与RGB图像进行融合达到标注目的的方法，特别涉及一种基于人机交互的半自动标注方法及系统。
技术介绍
随着互联网、机器学习、大数据和云计算等技术的飞速发展，各种信息数据以指数级的速度在持续增长，在大数据时代背景下，计算机视觉发展已经相对成熟，因而滋生出多样化的行业应用。标注数据集对深度学习而言是很重要的一步，但是标注数据是件很繁琐的工作，而半自动标注可以减轻工作量。即使现在有开源的半自动标注工具，但使用的前提是模型的精度越高越好，如果检测结果不准确，就会增加工作量，导致无法使用。而且使用半自动标注工具可能有出现检测结果不准确，有目标未被检测出来等情况，因此需要手动标注进行完善。但是由于模型的效率和精度很难达到平衡，所以就目前来看主流方法还是全人工标注。但人工标注数据集有以下几项弊端：1、数据标注人工成本高：目标检测算法需要海量标注样本，而目前海量的数据标注任务依赖人工方式实现，“有多少人工，就有多少智能”，造成制作标注数据集的成本高。2、人工标注的质量难以保证：不同的标注人员和标注团队存在判定尺度不一致问题，标注任务受标注人员和审查人员主观影响大，会引入一定的标注误差，数据一致性难以保证。3、目标检测数据集标注门槛高：相比于海量的数据标注需求，专业领域的标注人员过于稀缺，导致标注门槛高，标注的尺度也难以保持一致。
技术实现思路
本专利技术的目的在于克服上述技...

【技术保护点】
1.一种基于人机交互的半自动标注方法，所述方法包括：/n将待标注的RGB图像与产生的第一高斯热图进行融合；/n对融合图像进行预处理；/n将预处理后的融合图像输入预先建立和训练好的半自动标注模型，对待标注RGB图像标注多个预测框；/n当有预测框不满足要求，则通过产生第二高斯热图对不满足要求的预测框进行修正。/n

【技术特征摘要】
1.一种基于人机交互的半自动标注方法，所述方法包括：
将待标注的RGB图像与产生的第一高斯热图进行融合；
对融合图像进行预处理；
将预处理后的融合图像输入预先建立和训练好的半自动标注模型，对待标注RGB图像标注多个预测框；
当有预测框不满足要求，则通过产生第二高斯热图对不满足要求的预测框进行修正。

2.根据权利要求1所述的基于人机交互的半自动标注方法，其特征在于，所述将待标注的RGB图像与产生的第一高斯热图进行融合；具体包括：
利用与待标注的RGB图像对应的xml文件中左上坐标和右下坐标，在待标注RGB图像上确定目标所在区域，然后将目标所在区域内的所有像素点设为255，将目标所在区域外的像素点设为0，由此生成Mask图像；
在Mask图像的中心范围随机生成多个模拟点，由此生成第一高斯热图heat1：

其中，(x,y)为图像上的点坐标，(x1,m,y1,m)为第m个模拟点的坐标，M为模拟点的个数；sigma的值为10，r1＝4，代表模拟点的辐射范围；
将待标注的RGB图像与生成的第一高斯热图heat1进行add操作。

3.根据权利要求2所述的基于人机交互的半自动标注方法，其特征在于，所述半自动标注模型为加入注意力机制的Resnet50+FPN结构。

4.根据权利要求3所述的基于人机交互的半自动标注方法，其特征在于，所述方法还包括：对半自动标注模型进行训练的步骤，具体包括：
建立用于训练模型的数据集；数据集包括：标签文件集和图像文件集，标签文件集包括多个xml文件，图像文件集包括多个RGB图像，xml文件和RGB图像是一一对应的；
遍历数据集中的每一个RGB图像，利用对应的xml文件中左上坐标和右下坐标，在RGB图像上确定目标所在区域，然后将目标所在区域内的所有像素...

【专利技术属性】
技术研发人员：张新钰，李骏，李志伟，刘宇红，王力，卢一倩，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人