【技术实现步骤摘要】
一种图像标注方法及装置、计算机可读存储介质
本专利技术涉及但不限于图像识别
,尤其涉及一种图像标注方法及装置、计算机可读存储介质。
技术介绍
在计算机进行图像识别之前,需要获取大量的具有图像标注信息的图像进行深度学习和训练,从而计算机能够根据训练好的深度学习模型来自动识别和理解图像中包含的信息。这样,标注人员来需要进行大量的重复性的判断和操作来对图像进行标注,因此,为图像进行标注的过程中难免出现标注错误的情况。在实际应用中,图像标注错误严重影响了深度学习模型训练的准确性,为了正确得到图像的图像标注信息,现有技术中通过多个标注人员同时对同一个图像进行标注,这样不可避免地需要投入大量的人力成本和时间成本,降低了数据集优化和模型建立的效率。另外,相关技术中还涉及自动图像标注的方法,但是现有的自动图像标注方法通常需要人工提取图像中特定的特征向量,例如图像中的平均灰度值、亮度值等特征向量;若要全面地表示图像,这就需要采集多个特征向量,而采集的特征向量并不一定能完整地表征图像中所包含的信息;并且,该方法对于形态不同的图像数 ...
【技术保护点】
1.一种图像标注方法,其特征在于,所述方法包括:/n提取待处理图像的图像特征向量和参考图像集合中每个图像的图像特征向量;其中,所述参考图像集合包括至少两个具有图像标注信息的图像;所述图像特征向量中至少一个元素为连续值;所述图像标注信息是指能够描述图像内容的信息;/n基于所述待处理图像的图像特征向量和所述参考图像集合中每个图像的图像特征向量,得到所述待处理图像与参考图像集合中每个图像之间欧式距离;/n从所述参考图像集合中选取与所述待处理图像的欧式距离最小的至少部分图像作为目标图像集;/n至少基于所述目标图像集中每个图像的图像标注信息,对所述待处理图像的图像标注信息进行标注处理。/n
【技术特征摘要】
1.一种图像标注方法,其特征在于,所述方法包括:
提取待处理图像的图像特征向量和参考图像集合中每个图像的图像特征向量;其中,所述参考图像集合包括至少两个具有图像标注信息的图像;所述图像特征向量中至少一个元素为连续值;所述图像标注信息是指能够描述图像内容的信息;
基于所述待处理图像的图像特征向量和所述参考图像集合中每个图像的图像特征向量,得到所述待处理图像与参考图像集合中每个图像之间欧式距离;
从所述参考图像集合中选取与所述待处理图像的欧式距离最小的至少部分图像作为目标图像集;
至少基于所述目标图像集中每个图像的图像标注信息,对所述待处理图像的图像标注信息进行标注处理。
2.根据权利要求1所述的方法,其特征在于,所述至少基于所述目标图像集中每个图像的图像标注信息,为所述待处理图像的图像标注信息进行标注处理,包括:
基于所述目标图像集中每个图像的图像标注信息,获取出现次数最多的图像标注信息;
基于所述出现次数最多的图像标注信息,为所述待处理图像添加图像标注信息或校正所述待处理图像的图像标注信息。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标图像集中每个图像的图像标注信息,获取出现次数最多的图像标注信息之前,还包括:
基于第i个目标图像的图像特征向量和所述参考图像集合中每个图像的图像特征向量,计算所述第i个目标图像与参考图像之间欧式距离,并从所述参考图像中获取与所述第i个目标图像欧式距离最小的M个第i图像;其中,所述i为正整数,i大于等于1且小于等于所述目标图像集中图像的总数;所述M为正整数;
至少基于所述M个第i图像的图像标注信息,对所述第i个目标图像的图像标注信息进行校正,得到校正后的第i个目标图像的图像标注信息。
4.根据权利要求3所述的方法,其特征在于,所述至少基于所述M个第i图像的图像标注信息,对所述第i个目标图像的图像标注信息进行校正,包括:
基于所述M个第i图像的图像标注信息,获取出现次数最多的图像标注信息;
基于所述出现次数最多的图像标注信息,对所述第i个目标图像的图像标注信息进行校正。
5.根据权利要求1所述的方法,其特征在于,所述提取待处理图像的图像特征和参考图像集合中每个图像的图像特征,包括:
通过训练好的深度哈希编码模型对所述待处理图像和所述参考图像集合中的每个图像进行处理,得到所述待处理图像的图像编码以及所述参考图像中每个图像对应的图像编码;其中,所述图像编码用于表征对应图像的语义信息;
将所述待处理图像的图像编码作为所述待处理图像的图像特征向量;
将所述参考图像中每个图像对应的图像编码最为对应图像的图像特征向量。
6.根据权利要求5所述的方法,其特征在于,所述深度哈希编码模型的训练过程包括:
获取至少一个带有图像标注信息的图像作为训练图像集;其中,所述训练图像集中图像标注信息的类型至少包括所述待校正图像的图像标注信息的类型;
构建深度卷积神经网络,并将所述训练图像集输入至所述深度卷积神经网络中,得到第一输出结果;
根据所述第一输出结果和预设的损失函数调整所述卷积神经网络,得到所述训练好的深度哈希编码模型。
7.一种图像标注装置,其特...
【专利技术属性】
技术研发人员:邢东佳,张志鹏,寿文卉,许利群,
申请(专利权)人:中国移动通信有限公司研究院,中国移动通信集团有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。