【技术实现步骤摘要】
一种可微分随机图像数据扩充方法及系统
[0001]本专利技术属于计算机视觉以及人工智能领域,具体涉及了一种可微分随机图像数据扩充方法及系统。
技术介绍
[0002]数据扩充技术被广泛的用在基于人工智能的计算机视觉任务中,如分类、目标检测、目标分割、关键点识别等。该技术主要利用空间变换和色彩变换扩充原始数据,同时保证图像的高等级特征(如轮廓、形态等)在扩充得到的图像中被保留,因而可以在不额外收集新数据的情况下扩充数据,进而提升基于数据驱动的人工智能模型的性能。
[0003]目前数据扩充技术主要基于人为启发式设计,通过区域抹除、局部拼凑数据、颜色改变等手段实现数据的扩充,并取得了一定的效果。然而,基于人为设计的数据扩充方法虽然泛用性较强,但无法针对不同数据集的特点设计数据扩充方法。此外,现有技术还存在一些随机数据扩充方法,针对图像设计一系列随机变换算子,同样能达到提升人工智能模型的效果。该类方法简单,生成图像多样,实现容易,然而,现有的随机数据扩充方法同样没有考虑数据集之间特征的差异。
[0004]因此,本领域还需要针对数据集特点而设计定制化数据扩充方法,以帮助人工智能方法更精准地实现目标计算机视觉任务。
技术实现思路
[0005]为了解决现有技术中的上述问题,即现有技术没有考虑数据集之间特征的差异,从而扩充后的数据集对人工智能方法更精准地实现目标计算机视觉任务的帮助较低的问题,本专利技术提供了一种可微分随机图像数据扩充方法,所述扩充方法包括:
[0006]步骤S100,定义待扩充 ...
【技术保护点】
【技术特征摘要】
1.一种可微分随机图像数据扩充方法,其特征在于,所述扩充方法包括:步骤S100,定义待扩充图像数据的扩充搜索空间,定义扩充搜索空间对应的算子可微分参数;步骤S200,构建空间搜索神经网络模型,并基于待扩充图像数据,以模型损失最小化为方向进行算子可微分参数的前向训练,获得扩充算子的采样权重及变换幅度所服从的正态分布;步骤S300,基于扩充算子的采样权重进行扩充算子的松弛采样,基于扩充算子的变换幅度所服从的正态分布进行正态分布采样,并对采样结果进行归一化,获得最终扩充算子和变换幅度;步骤S400,基于所述最终扩充算子和变换幅度进行待扩充图像数据的扩充。2.根据权利要求1所述的可微分随机图像数据扩充方法,其特征在于,步骤S100中定义待扩充图像数据的扩充搜索空间,包括:步骤S110,定义待扩充图像数据的算子集合,所述算子集合包括空间变换算子和色彩变换算子;步骤S120,分别定义所述算子集合中每个算子的变换幅度,并进行变换幅度的归一化,所述空间算子包括平移算子、旋转算子和仿射算子,所述色彩变换算子包括对比度拉伸算子、灰度化算子和取反算子;步骤S130,所述算子集合对应的算子采样权重集合及每个算子的归一化变换幅度构成待扩充图像数据的扩充搜索空间。3.根据权利要求2所述的可微分随机图像数据扩充方法,其特征在于,步骤S120中分别定义所述算子集合中每个算子的变换幅度,包括:定义每个算子的变换幅度的有效范围,包括平移算子的平移距离、旋转算子的旋转角度和对比度拉伸算子的拉伸比例。4.根据权利要求2所述的可微分随机图像数据扩充方法,其特征在于,步骤S100中定义算子可微分参数,包括:步骤S140,赋予所述算子集合中每个算子一个可学习的采样权重,并通过松弛采样实现算子采样权重的可微分处理,获得可微分算子采样权重;步骤S150,令每个算子的变换幅度服从可学习的正态分布,并通过重参数化实现算子变换幅度正态分布的可微分处理,获得可微分算子变换幅度的正态分布;步骤S160,可微分算子的采样权重和可微分算子变换幅度的正态分布构成搜索空间对应的算子可微分参数。5.根据权利要求4所述的可微分随机图像数据扩充方法,其特征在于,步骤S140中通过松弛采样实现算子采样权重的可微分处理,包括:其中,为算子集合O中的任一算子o的可微分采样权重,w
o
为算子集合O中任一算子o的采样权重,w
o
′
为算子集合O中任一算子o
′
的采样权重,g
o
=
‑
log(
‑
log(u)),u~U(0,1),g
o
为o对应的随机系数,g
o
′
=
‑
log(
‑
log(u
′
)),u
′
~U(0,1),g
o
′
为o
′
对应的随机系...
【专利技术属性】
技术研发人员:田捷,胡振华,肖安琪,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。