图像数据的处理方法、装置、设备及存储介质制造方法及图纸

技术编号:26792748 阅读:31 留言:0更新日期:2020-12-22 17:08
本公开关于一种图像数据的处理方法、装置、设备及存储介质,其中,方法包括:获取第一图像数据集,对第一图像数据集进行筛选处理,得到第二图像数据集;对第二图像数据集进行分类操作,得到多个第一图像数据簇,并确定各第一图像数据簇的第一核心特征向量;获取第三图像数据集,对第三图像数据集进行分类操作,得到多个第二图像数据簇,并确定各第二图像数据簇的第二核心特征向量;分别计算每个第一核心特征向量与每个第二核心特征向量的相似度,并根据相似度确定第四图像数据集。本公开的方案,可以解决人工确定标注错误的图像数据耗时长且准确率低的问题,可以快速且准确的确定标注错误的图像数据,为提升深度学习预测模型的准确率提供依据。

【技术实现步骤摘要】
图像数据的处理方法、装置、设备及存储介质
本公开涉及本公开涉及计算机
,尤其涉及一种图像数据的处理方法、装置、设备及存储介质。
技术介绍
随着计算机技术的不断发展,深度学习等智能算法被广泛用来解决各种日常问题,例如,通过深度学习模型实现图像分类、行人检测以及车牌识别等日常问题。相关技术中,当深度学习预测模型对测试数据集进行测试,得到测试结果之后,需要通过开发人员根据经验来确定该模型的性能,并查找是否存在标注错误的图像数据。但是,这种方法需要依据开发人员的经验,判断结果存在主观性,同时也会存在耗时较长,并且很难准确的确定图像数据是否标注错误等问题。
技术实现思路
本公开提供一种图像数据的处理方法、装置、设备及存储介质,以至少解决相关技术中确定标注错误的图像数据耗时长,且准确率低的问题。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种图像数据的处理方法,包括:获取第一图像数据集,对所述第一图像数据集进行筛选处理,得到第二图像数据集;对所述第二图像数据集进行分类操作,得到多个第一图像数据簇,并确定各所述第一图像数据簇的第一核心特征向量;获取第三图像数据集,对所述第三图像数据集进行分类操作,得到多个第二图像数据簇,并确定各所述第二图像数据簇的第二核心特征向量;分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的相似度,并根据所述相似度确定第四图像数据集。可选的,所述对所述第一图像数据集进行筛选处理,得到第二图像数据集步骤包括:通过深度学习预测模型对第一图像数据集进行测试,得到多个预测结果;将各所述预测结果中预测标签与标注标签不一致的图像数据确定为目标图像数据;确定预测概率大于第一设定阈值的各所述目标图像数据为所述第二图像数据集。可选的,所述对所述第二图像数据集进行分类操作,得到多个第一图像数据簇,并确定各所述第一图像数据簇的第一核心特征向量步骤包括:对所述第二图像数据集进行分组操作,得到多个第二图像数据组;其中,每个第二图像数据组中包含的各图像数据的标签相同;将目标第二图像数据组输入至深度学习预测模型中,提取所述目标第二图像数据组中的各图像数据的语义特征向量;对各所述语义特征向量进行分类操作,得到多个第一图像数据簇;确定各所述第一图像数据簇的中心向量,作为各图像数据簇的第一核心特征向量。可选的,所述对所述第三图像数据集进行分类操作,得到多个第二图像数据簇,并确定各所述第二图像数据簇的第二核心特征向量步骤包括:对所述第三图像数据集进行分组操作,得到多个第三图像数据组;其中,每个第三图像数据组中包含的各图像数据的标签相同;将目标第三图像数据组输入至深度学习预测模型中,提取所述目标第三图像数据组中的各图像数据的语义特征向量;对各所述语义特征向量进行分类操作,得到多个第二图像数据簇;确定各所述第二图像数据簇的中心向量,作为各图像数据簇的第二核心特征向量。可选的,所述分别计算所述第一核心特征向量与所述第二核心特征向量的相似度步骤包括:分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的之间的两两夹角,并根据所述夹角确定所述相似度。可选的,所述根据所述相似度确定第四图像数据集步骤包括:当目标相似度大于设定阈值时,确定与所述目标相似度对应的第二图像数据簇为所述第四图像数据集。可选的,在获取第一图像数据集步骤之前,所述方法还包括:获取深度学习预测模型;相应的,所述获取深度学习预测模型步骤包括:获取对目标数据集进行标注而确定的标注集,所述标注集包括第三图像数据集和第一图像数据集;将所述第三图像数据集输入至深度学习训练模型中进行训练,得到所述深度学习预测模型。可选的,在所述根据所述相似度确定第四图像数据集步骤之后,所述方法还包括:重新对第四图像数据集中的各图像数据进行分类,并根据重新标注的图像数据更新第三图像数据集;根据更新后的第三图像数据集更新深度学习预测模型,得到最终深度学习预测模型。可选的,在对各所述语义特征向量进行分类操作,得到多个第一图像数据簇步骤之后,所述方法还包括:若目标图像数据簇包含的图像数据的数量小于第二设定阈值,则删除所述目标图像数据簇。根据本公开实施例的第二方面,提供一种图像数据的处理装置,包括:第一获取模块,被配置为获取第一图像数据集,对所述第一图像数据集进行筛选处理,得到第二图像数据集,确定模块,被配置为对所述第二图像数据集进行分类操作,得到多个第一图像数据簇的,并确定各所述第一图像数据簇的第一核心特征向量;第二获取模块,被配置为获取第三图像数据集,对所述第三图像数据集进行分类操作,得到多个第二图像数据簇,并确定各所述第二图像数据簇的第二核心特征向量计算模块,被配置为分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的相似度,并根据所述相似度确定标注错误的第四图像数据集。可选的,所述第一获取模块,具体被配置为通过深度学习预测模型对第一图像数据集进行测试,得到多个预测结果;将各所述预测结果中预测标签与标注标签不一致的图像数据确定为目标图像数据;确定预测概率大于第一设定阈值的各所述目标图像数据为所述第二图像数据集。可选的,所述确定模块,具体被配置为对所述第二图像数据集进行分组操作,得到多个第二图像数据组;其中,每个第二图像数据组中包含的各图像数据的标签相同;将目标第二图像数据组输入至深度学习预测模型中,提取所述目标第二图像数据组中的各图像数据的语义特征向量;对各所述语义特征向量进行分类操作,得到多个第一图像数据簇;确定各所述第一图像数据簇的中心向量,作为各图像数据簇的第一核心特征向量。可选的,所述第二获取模块,具体被配置为对所述第三图像数据集进行分组操作,得到多个第三图像数据组;其中,每个第三图像数据组中包含的各图像数据的标签相同;将目标第三图像数据组输入至深度学习预测模型中,提取所述目标第三图像数据组中的各图像数据的语义特征向量;对各所述语义特征向量进行分类操作,得到多个第二图像数据簇;确定各所述第二图像数据簇的中心向量,作为各图像数据簇的第二核心特征向量。可选的,所述计算模块,具体被配置为分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的之间的两两夹角,并根据所述夹角确定所述相似度。可选的,所述计算模块,包括:确定子模块,被配置为当目标相似度大于设定阈值时,确定与所述目标相似度对应的第二图像数据簇为所述第四图像数据集。可选的,所述装置还包括:深度学习预测模型获取模块,被配置为获取对目标数据集进行标注而确定的标注集,所述标注集包括第三图像数据集和第一图像数据集;将所述第三图像数据集输入至深度学习训本文档来自技高网...

【技术保护点】
1.一种图像数据的处理方法,其特征在于,包括:/n获取第一图像数据集,对所述第一图像数据集进行筛选处理,得到第二图像数据集;/n对所述第二图像数据集进行分类操作,得到多个第一图像数据簇,并确定各所述第一图像数据簇的第一核心特征向量;/n获取第三图像数据集,对所述第三图像数据集进行分类操作,得到多个第二图像数据簇,并确定各所述第二图像数据簇的第二核心特征向量;/n分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的相似度,并根据所述相似度确定第四图像数据集。/n

【技术特征摘要】
1.一种图像数据的处理方法,其特征在于,包括:
获取第一图像数据集,对所述第一图像数据集进行筛选处理,得到第二图像数据集;
对所述第二图像数据集进行分类操作,得到多个第一图像数据簇,并确定各所述第一图像数据簇的第一核心特征向量;
获取第三图像数据集,对所述第三图像数据集进行分类操作,得到多个第二图像数据簇,并确定各所述第二图像数据簇的第二核心特征向量;
分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的相似度,并根据所述相似度确定第四图像数据集。


2.根据权利要求1所述的方法,其特征在于,所述对所述第一图像数据集进行筛选处理,得到第二图像数据集步骤包括:
通过深度学习预测模型对第一图像数据集进行测试,得到多个预测结果;
将各所述预测结果中预测标签与标注标签不一致的图像数据确定为目标图像数据;
确定预测概率大于第一设定阈值的各所述目标图像数据为所述第二图像数据集。


3.根据权利要求1所述的方法,其特征在于,所述对所述第二图像数据集进行分类操作,得到多个第一图像数据簇,并确定各所述第一图像数据簇的第一核心特征向量步骤包括:
对所述第二图像数据集进行分组操作,得到多个第二图像数据组;其中,每个第二图像数据组中包含的各图像数据的标签相同;
将目标第二图像数据组输入至深度学习预测模型中,提取所述目标第二图像数据组中的各图像数据的语义特征向量;
对各所述语义特征向量进行分类操作,得到多个第一图像数据簇;
确定各所述第一图像数据簇的中心向量,作为各图像数据簇的第一核心特征向量。


4.根据权利要求1所述的方法,其特征在于,所述对所述第三图像数据集进行分类操作,得到多个第二图像数据簇,并确定各所述第二图像数据簇的第二核心特征向量步骤包括:
对所述第三图像数据集进行分组操作,得到多个第三图像数据组;其中,每个所述第三图像数据组中包含的各图像数据的标签相同;
将目标第三图像数据组输入至深度学习预测模型中,提取所述目标第三图像数据组中的各图像数据的语义特征向量;
对各所述语义特征向量进行分类操作,...

【专利技术属性】
技术研发人员:申世伟
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1