【技术实现步骤摘要】
一种多人在线的图像半自动标注方法及系统
本专利技术涉及工业产品缺陷检测
,特别涉及一种多人在线的图像半自动标注方法及系统。
技术介绍
近几年来,人工智能技术正以前所未有的速度改变制造业生产模式。其中,以卷积神经网络为代表的深度学习技术极大提升了目标检测算法的精度的准确度,这使得在工业质检产线上部署深度学习模型变成了可能。由于深度学习模型具有上亿个参数,具有极强的泛化能力,因此能够适应非常复杂的场景。特别是在复杂的工业场景下,以深度学习为代表的目标检测算法能发挥巨大的作用。但是为了训练一个大型的神经网络模型,需要大量的人工标注数据。按照人工介入程度不同,目前的标注方法可分为:手工标注方法和半自动交互式标注方法。人工标注的方法一般操作步骤是由专业人员设定标注规范和标准,制作标注样例,然后将采集的样本图片交给标注员工进行学习标注,最后由质检员对标注结果进行检查。但是实际标注过程中,由于专业人员的标准设定不清晰,标注员工对标注规范的理解有差异,质检员的错误判断,都会导致部分目标的漏标或者错标,而这些漏标或者误标的样本会 ...
【技术保护点】
1.一种多人在线的图像半自动标注方法,其特征在于,包括以下步骤:/nS1:首先制定工业产品缺陷标准,将初始的缺陷样本随机划分为2个不同的数据集,其中第一批样本按照传统人工标注的流程,安排专业标注人员对图像中的缺陷用矩形框的形式标注出来,安排另外一批人员对标注结果进行检查得到初始的训练数据集,即人工标注数据集,另一批样本作为半自动标注数据集;/nS2:将人工标注数据集的图片和相应的人工标注文件上传到云端服务器,使用数字图像处理中的数据增强算法进一步扩展训练数据集,调用云端服务器的目标检测模型训练脚本,评价不同算法预测结果的精度,得到精度最高的预检测模型的权重文件;/nS3:将 ...
【技术特征摘要】
1.一种多人在线的图像半自动标注方法,其特征在于,包括以下步骤:
S1:首先制定工业产品缺陷标准,将初始的缺陷样本随机划分为2个不同的数据集,其中第一批样本按照传统人工标注的流程,安排专业标注人员对图像中的缺陷用矩形框的形式标注出来,安排另外一批人员对标注结果进行检查得到初始的训练数据集,即人工标注数据集,另一批样本作为半自动标注数据集;
S2:将人工标注数据集的图片和相应的人工标注文件上传到云端服务器,使用数字图像处理中的数据增强算法进一步扩展训练数据集,调用云端服务器的目标检测模型训练脚本,评价不同算法预测结果的精度,得到精度最高的预检测模型的权重文件;
S3:将预检测模型部署在云端服务器上,设置模型调用接口和IP地址,本地标注客户端将序列化的图片通过post消息的方式将数据传输到云端服务器上,云端服务器接收标注客户端数据并反序列化得到原始的图像数据,然后调用当前的预检测模型对图像中的缺陷位置和种类进行预测,最后云端服务器将预测结果存储为json文件并通过网络传输到本地标注客户端;
S4:多个本地标注客户端接受云端服务器传回的数据,解析传回的json文件,获得预检测模型输出的缺陷种类和位置坐标信息,将结果实时的显示在标注软件上,通过人工交互的方式判断当前预测结果是否正确,对于符合标准的预测结果不做修改,对于预测错误或者漏检的部分,人工的修改标注结果或者增加标注框,直至该张图片符合标准数据集的规范为止;
S5:当半自动标注数据集标注完成十分之一后,将半自动标注数据集和人工标注数据集合并,重复步骤S2至步骤S5,直至所有样本图像都标注完成或者目标检测模型平均精度提升低于0.1%为止。
2.根据权利要求1所述的一种多人在线的图像半自动标注方法,其特征在于,所述步骤S1包括:
按照工业产品的质量检测要求,制定缺陷标准,包括缺陷种类和缺陷位置大小指标,将原始的缺陷样本随机打乱,根据1:9至1:1的比例将样本划分为两个数据集,按照标注方式的不同分别称为人工标注数据集和半自动标注数据集,其中,人工标注数据集远远小于半自动标注数据集,同时,每一个数据集中还需要保证每一类缺陷样本数量至少有50张,人工标注数据集按照一般人工标注的流程,首先由技术人员对图片进行标注,然后安排一组质检人员对标注结果进行检查。
3.根据权利要求1所述的一种多人在线的图像半自动标注方法,其特征在于,所述步骤S2包括:
使用旋转、平移、放大、缩小、色彩变换、混合(mixup)和裁剪(cutup)的方法对原有数据集进行扩充;
使用目标检测算法的训练脚本进行模型训练直至模型收敛,评价目标检测结果的精度得到最优的目标检测模型。
4.根据权利要求1所述的一种多人在线的图像半自动标注方法,其特征在于,所...
【专利技术属性】
技术研发人员:杨青,祝飞,庞陈雷,王立强,周长江,
申请(专利权)人:之江实验室,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。