图像数据清洗方法、控制装置及可读存储介质制造方法及图纸

技术编号:36024132 阅读:51 留言:0更新日期:2022-12-21 10:21
本发明专利技术涉及图像识别技术领域,具体提供一种图像数据清洗方法、控制装置及可读存储介质,旨在解决如何更为准确高效地实现图像数据的清洗的问题。为此目的,本发明专利技术对待清洗图像集合中的待清洗图像进行特征提取,获取待清洗图像的颜色矩特征,并应用训练好的异常检测算法模型对每张待清洗图像进行异常图像检测,获取待清洗图像集合的异常分数集合,并根据异常分数集合以及预设的异常图像比例,获取待清洗图像集合中的异常图像。本发明专利技术不再需要人为处理待清洗图像集合中的异常图像,即可实现准确高效的进行图像数据的清洗,有效地节省了人力和时间成本。和时间成本。和时间成本。

【技术实现步骤摘要】
图像数据清洗方法、控制装置及可读存储介质


[0001]本专利技术涉及图像识别
,具体提供一种图像数据清洗方法、控制装置及可读存储介质。

技术介绍

[0002]在训练智能生鲜电子秤上的AI算法前期,需要对采集的大量生鲜图像进行数据清洗,其中包含空盘图像、空袋图里面没有生鲜的图像、不是此类别生鲜的图像、拍摄过于模糊的图像等。通常的处理方法是人为将这些异常图像删除。但是,由于图像的数据量巨大,人为删除过程往往费时费力。
[0003]相应地,本领域需要一种新的图像数据清洗方案来解决上述问题。

技术实现思路

[0004]为了克服上述缺陷,提出了本专利技术,以提供解决或至少部分地解决如何更为准确高效地实现图像数据的清洗的问题。
[0005]在第一方面,本专利技术提供一种图像数据清洗方法,所述方法包括:
[0006]对待清洗图像集合中的待清洗图像进行特征提取,获取所述待清洗图像的颜色矩特征;
[0007]应用预设的训练好的异常检测算法模型,根据所述待清洗图像的颜色矩特征,对每张所述待清洗图像进行异常图像检测,获得所述待清洗图像集合的异常分数集合;
[0008]根据所述异常分数集合及预设的异常图像比例,获取所述待清洗图像集合中的异常图像以供从所述待清洗图像集合中删除。
[0009]在上述图像数据清洗方法的一个技术方案中,所述对待清洗图像集合中的待清洗图像进行特征提取,获取所述待清洗图像的颜色矩特征,包括:
[0010]针对每张待清洗图像,将所述待清洗图像从RGB颜色空间转换至HSV颜色空间,以获取所述待清洗图像的每个像素点的色调、饱和度和亮度;
[0011]根据所述待清洗图像的每个像素点的色调、饱和度和亮度获取所述待清洗图像的颜色矩特征。
[0012]在上述图像数据清洗方法的一个技术方案中,所述颜色矩特征包括一阶矩特征、二阶矩特征和三阶矩特征;
[0013]所述根据所述待清洗图像的每个像素点的色调、饱和度和亮度获取所述待清洗图像的颜色矩特征,包括:
[0014]根据以下公式获取所述待清洗图像的一阶矩特征、二阶矩特征和三阶矩特征:
[0015][0016][0017][0018]其中,E
i
、σ
i
、s
i
分别为待清洗图像的第i个颜色通道的一阶矩特征、二阶矩特征和三阶矩特征,所述颜色通道包括色调、饱和度和亮度;N为所述待清洗图像中像素点的总数;p
ij
为第j个像素点在第i个颜色通道上的像素值,所述像素值为所述颜色通道中对应的色调或饱和度或亮度的值。
[0019]在上述图像数据清洗方法的一个技术方案中,所述异常检测算法模型为基于孤立森林的异常检测算法模型。
[0020]在上述图像数据清洗方法的一个技术方案中,所述方法还包括根据以下步骤获取训练好的异常检测算法模型:
[0021]获取预设的训练集中图像的颜色矩特征;
[0022]根据所述颜色矩特征,构建多棵二叉树,并根据多棵二叉树获得基于孤立森林的异常检测算法模型;
[0023]通过递归切分所述训练集的颜色矩特征组成的数据集,对所述基于孤立森林的异常检测算法模型进行迭代训练,直至满足迭代收敛条件,以获取训练好的异常检测算法模型;
[0024]其中,所述迭代收敛条件为:所述数据集的所有数据点都得到完整切分,或,所述二叉树的高度达到预设的高度阈值。
[0025]在上述图像数据清洗方法的一个技术方案中,所述根据所述异常分数集合及预设的异常图像比例,获取所述待清洗图像集合中的异常图像,包括:
[0026]获取所述异常分数集合中的异常分数最大值和异常分数最小值;
[0027]根据所述异常分数最大值、异常分数最小值和所述异常图像比例,获取异常分数阈值;
[0028]根据所述异常分数阈值,获取所述待清洗图像集合中的异常图像。
[0029]在上述图像数据清洗方法的一个技术方案中,所述根据所述异常分数最大值、异常分数最小值和所述异常图像比例,获取异常分数阈值,包括:
[0030]根据以下公式获取所述异常分数阈值:
[0031]k=value
min
+(value
max

value
min
)
×
Con
[0032]其中,k为所述异常分数阈值,value
max
为所述异常分数最大值,value
min
为所述异常分数最小值,Con为所述异常图像比例。
[0033]在上述图像数据清洗方法的一个技术方案中,
[0034]所述根据所述异常分数阈值,获取所述待清洗图像集合中的异常图像,包括:
[0035]将每张待清洗图像的异常分数与所述异常分数阈值进行比较;
[0036]当所述异常分数大于所述异常分数阈值时,将所述异常分数对应的待清洗图像作为异常图像。
[0037]在第二方面,提供一种控制装置,该控制装置包括处理器和存储装置,所述存储装置适于存储多条程序代码,所述程序代码适于由所述处理器加载并运行以执行上述图像数据清洗方法的技术方案中任一项技术方案所述的图像数据清洗方法。
[0038]在第四方面,提供一种计算机可读存储介质,该计算机可读存储介质其中存储有
多条程序代码,所述程序代码适于由处理器加载并运行以执行上述图像数据清洗方法的技术方案中任一项技术方案所述的图像数据清洗方法。
[0039]本专利技术上述一个或多个技术方案,至少具有如下一种或多种有益效果:
[0040]在实施本专利技术的技术方案中,本专利技术对待清洗图像集合中的待清洗图像进行特征提取,获取待清洗图像的颜色矩特征,并应用训练好的异常检测算法模型对每张待清洗图像进行异常图像检测,获取待清洗图像集合的异常分数集合,并根据异常分数集合以及预设的异常图像比例,获取待清洗图像集合中的异常图像。通过上述配置方式,本专利技术通过对待清洗图像进行特征提取和异常图像检测,就能够根据获取的异常分数集合和异常图像比例,确定需要从待清洗图像集合中删除的异常图像,不再需要人为逐张处理待清洗图像集合中的异常图像,即可实现准确高效的进行图像数据的清洗,有效地节省了人力和时间成本。
附图说明
[0041]参照附图,本专利技术的公开内容将变得更易理解。本领域技术人员容易理解的是:这些附图仅仅用于说明的目的,而并非意在对本专利技术的保护范围组成限制。其中:
[0042]图1是根据本专利技术的一个实施例的图像数据清洗方法的主要步骤流程示意图;
[0043]图2是HSV颜色空间的模型示意图;
[0044]图3是根据一个示例的构建二叉树的主要步骤流程示意图;
[0045]图4是基于孤立森林的异常检测算法模型中二叉树的平均高度与异常分数的关系示意图。
具体实施方式
[0046]下面参照附图来描述本专利技术的一些实施方式。本领域本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像数据清洗方法,其特征在于,所述方法包括:对待清洗图像集合中的待清洗图像进行特征提取,获取所述待清洗图像的颜色矩特征;应用预设的训练好的异常检测算法模型,根据所述待清洗图像的颜色矩特征,对每张所述待清洗图像进行异常图像检测,获得所述待清洗图像集合的异常分数集合;根据所述异常分数集合及预设的异常图像比例,获取所述待清洗图像集合中的异常图像以供从所述待清洗图像集合中删除。2.根据权利要求1所述的图像数据清洗方法,其特征在于,所述对待清洗图像集合中的待清洗图像进行特征提取,获取所述待清洗图像的颜色矩特征,包括:针对每张待清洗图像,将所述待清洗图像从RGB颜色空间转换至HSV颜色空间,以获取所述待清洗图像的每个像素点的色调、饱和度和亮度;根据所述待清洗图像的每个像素点的色调、饱和度和亮度获取所述待清洗图像的颜色矩特征。3.根据权利要求2所述的图像数据清洗方法,其特征在于,所述颜色矩特征包括一阶矩特征、二阶矩特征和三阶矩特征;所述根据所述待清洗图像的每个像素点的色调、饱和度和亮度获取所述待清洗图像的颜色矩特征,包括:根据以下公式获取所述待清洗图像的一阶矩特征、二阶矩特征和三阶矩特征:根据以下公式获取所述待清洗图像的一阶矩特征、二阶矩特征和三阶矩特征:根据以下公式获取所述待清洗图像的一阶矩特征、二阶矩特征和三阶矩特征:其中,E
i
、σ
i
、s
i
分别为待清洗图像的第i个颜色通道的一阶矩特征、二阶矩特征和三阶矩特征,所述颜色通道包括色调、饱和度和亮度;N为所述待清洗图像中像素点的总数;p
ij
为第j个像素点在第i个颜色通道上的像素值,所述像素值为所述颜色通道中对应的色调或饱和度或亮度的值。4.根据权利要求1所述的图像数据清洗方法,其特征在于,所述异常检测算法模型为基于孤立森林的异常检测算法模型。5.根据权利要求4所述的图像数据清洗方法,其特征在于,所述方法还包括根据以下步骤获取训练好的异常检测算法模型:获取预设的训练集中图像的颜色矩特征;
根据所述颜色矩特征,构建...

【专利技术属性】
技术研发人员:王闯
申请(专利权)人:北京结慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1