图像数据的处理方法、装置、设备及存储介质制造方法及图纸

技术编号：26792748 阅读：31 留言：0更新日期：2020-12-22 17:08

本公开关于一种图像数据的处理方法、装置、设备及存储介质，其中，方法包括：获取第一图像数据集，对第一图像数据集进行筛选处理，得到第二图像数据集；对第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各第一图像数据簇的第一核心特征向量；获取第三图像数据集，对第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各第二图像数据簇的第二核心特征向量；分别计算每个第一核心特征向量与每个第二核心特征向量的相似度，并根据相似度确定第四图像数据集。本公开的方案，可以解决人工确定标注错误的图像数据耗时长且准确率低的问题，可以快速且准确的确定标注错误的图像数据，为提升深度学习预测模型的准确率提供依据。

全部详细技术资料下载

【技术实现步骤摘要】
图像数据的处理方法、装置、设备及存储介质
本公开涉及本公开涉及计算机
，尤其涉及一种图像数据的处理方法、装置、设备及存储介质。
技术介绍
随着计算机技术的不断发展，深度学习等智能算法被广泛用来解决各种日常问题，例如，通过深度学习模型实现图像分类、行人检测以及车牌识别等日常问题。相关技术中，当深度学习预测模型对测试数据集进行测试，得到测试结果之后，需要通过开发人员根据经验来确定该模型的性能，并查找是否存在标注错误的图像数据。但是，这种方法需要依据开发人员的经验，判断结果存在主观性，同时也会存在耗时较长，并且很难准确的确定图像数据是否标注错误等问题。
技术实现思路
本公开提供一种图像数据的处理方法、装置、设备及存储介质，以至少解决相关技术中确定标注错误的图像数据耗时长，且准确率低的问题。本公开的技术方案如下：根据本公开实施例的第一方面，提供一种图像数据的处理方法，包括：获取第一图像数据集，对所述第一图像数据集进行筛选处理，得到第二图像数据集；对所述第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各所述第一图像数据簇的第一核心特征向量；获取第三图像数据集，对所述第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各所述第二图像数据簇的第二核心特征向量；分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的相似度，并根据所述相似度确定第四图像数据集。可选的，所述对所述第一图像数据集进行筛选处理，得到第二图像...

【技术保护点】
1.一种图像数据的处理方法，其特征在于，包括：/n获取第一图像数据集，对所述第一图像数据集进行筛选处理，得到第二图像数据集；/n对所述第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各所述第一图像数据簇的第一核心特征向量；/n获取第三图像数据集，对所述第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各所述第二图像数据簇的第二核心特征向量；/n分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的相似度，并根据所述相似度确定第四图像数据集。/n

【技术特征摘要】
1.一种图像数据的处理方法，其特征在于，包括：
获取第一图像数据集，对所述第一图像数据集进行筛选处理，得到第二图像数据集；
对所述第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各所述第一图像数据簇的第一核心特征向量；
获取第三图像数据集，对所述第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各所述第二图像数据簇的第二核心特征向量；
分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的相似度，并根据所述相似度确定第四图像数据集。

2.根据权利要求1所述的方法，其特征在于，所述对所述第一图像数据集进行筛选处理，得到第二图像数据集步骤包括：
通过深度学习预测模型对第一图像数据集进行测试，得到多个预测结果；
将各所述预测结果中预测标签与标注标签不一致的图像数据确定为目标图像数据；
确定预测概率大于第一设定阈值的各所述目标图像数据为所述第二图像数据集。

3.根据权利要求1所述的方法，其特征在于，所述对所述第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各所述第一图像数据簇的第一核心特征向量步骤包括：
对所述第二图像数据集进行分组操作，得到多个第二图像数据组；其中，每个第二图像数据组中包含的各图像数据的标签相同；
将目标第二图像数据组输入至深度学习预测模型中，提取所述目标第二图像数据组中的各图像数据的语义特征向量；
对各所述语义特征向量进行分类操作，得到多个第一图像数据簇；
确定各所述第一图像数据簇的中心向量，作为各图像数据簇的第一核心特征向量。

4.根据权利要求1所述的方法，其特征在于，所述对所述第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各所述第二图像数据簇的第二核心特征向量步骤包括：
对所述第三图像数据集进行分组操作，得到多个第三图像数据组；其中，每个所述第三图像数据组中包含的各图像数据的标签相同；
将目标第三图像数据组输入至深度学习预测模型中，提取所述目标第三图像数据组中的各图像数据的语义特征向量；
对各所述语义特征向量进行分类操作，...

【专利技术属性】
技术研发人员：申世伟，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人