一种数据扩充方法及装置制造方法及图纸

技术编号:24168554 阅读:30 留言:0更新日期:2020-05-16 02:12
本发明专利技术涉及人工智能技术领域,公开了一种数据扩充方法及装置。该方法包括:设置匹配阈值;获取带标注的原始数据集及其对应目标集合;根据所述匹配阈值,获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域;对所述目标区域进行数据增强处理,获取增强目标区域;将所述增强目标区域添加到所述当前原始数据中,获取带有增强目标区域的原始数据样本。采用本发明专利技术技术方案不但可以对个性化问题进行针对性数据扩充,且成本不高。

A data expansion method and device

【技术实现步骤摘要】
一种数据扩充方法及装置
本专利技术涉及人工智能
,特别涉及一种数据扩充方法及装置。
技术介绍
随着人工智能和计算机技术的发展,深度学习被广泛应用于人们的生产和生活中。通过大量数据的训练,深度学习在分类,目标检测等方面明显优于传统方法。然而,数据收集难度较大,尤其是小样本数据,收集周期较长,时间成本较高。另外,数据标注工作量繁重,需要大量成熟标注员长期标注,人力成本较高,标注效果和效率和标注员的标注水平相关度较大这也增加了数据标注的不确定性。因此,基于现有数据进行数据扩充,用于模拟现实场景变得尤为重要。在现有技术的实现过程中,专利技术人发现现有技术至少存在如下技术问题:现有技术中,数据扩充并未对个性化问题进行针对性数据扩充,使得数据扩充方法效果不加,且数据扩充成本较高。
技术实现思路
本专利技术的目的在于提供一种数据扩充方法及装置,以克服现有技术中的缺陷。为解决上述技术问题,本专利技术的实施方式提供了一种数据扩充方法,包括:设置匹配阈值;获取带标注的原始数据集及其对应目标集合;根据所述匹配阈值,获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域;对所述目标区域进行数据增强处理,获取增强目标区域;将所述增强目标区域添加到所述当前原始数据中,获取带有增强目标区域的原始数据样本。为解决上述技术问题,本专利技术的实施方式还提供了一种数据扩充装置,包括:预设单元,用于设置匹配阈值;信息获取单元,用于获取带标注的原始数据集及其对应目标集合;目标获取单元,用于根据所述匹配阈值,获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域;增强单元,用于对所述目标区域进行数据增强处理,获取增强目标区域;样本信息获取单元,用于将所述增强目标区域添加到所述当前原始数据中,获取带有增强目标区域的原始数据样本。本专利技术提供的一种数据扩充方法及装置,通过设置匹配阈值;获取带标注的原始数据集及其对应目标集合;根据所述匹配阈值,获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域;对所述目标区域进行数据增强处理,获取增强目标区域;将所述增强目标区域添加到所述当前原始数据中,获取带有增强目标区域的原始数据样本。采用本专利技术技术方案不但可以对个性化问题进行针对性数据扩充,且成本不高。附图说明图1是本专利技术实施例提供的一种数据扩充方法流程图;图2是本专利技术实施例提供的一种数据扩充装置结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本专利技术各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。本专利技术的第一实施方式涉及一种数据扩充方法。具体流程如图1所示。该方法包括:101:设置匹配阈值;102:获取带标注的原始数据集及其对应目标集合;103:根据所述匹配阈值,获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域;104:对所述目标区域进行数据增强处理,获取增强目标区域;105:将所述增强目标区域添加到所述当前原始数据中,获取带有增强目标区域的原始数据样本。需要说明的是,所述获取带标注的原始数据集及其对应目标集合的步骤,包括:获取带标注的原始数据集及待检测目标信息;根据所述待检测目标信息,从所述带标注的原始数据集,获取所述目标集合;所述目标集合包括:所述待检测目标类别,高和宽。还需要说明的是,该方法还包括:对所述增强目标区域的图像边缘进行平滑处理。还需要说明的是,所述将所述增强目标区域添加到所述当前原始数据中,获取带有增强目标区域的原始数据样本的步骤包括:设置等效边长阈值;判断所述当前原始数据中的目标区域的等效边长是否超过所述等效边长阈值;以上所述等效边长公式:其中,w为所述原始数据中目标区域的宽度,h为所述原始数据中目标区域的高度,a为等效边长。如果超过所述等效边长阈值,则采用所述增强目标区域替换原始数据样本的目标区域,获取带有增强目标区域的原始数据样本;如果不超过所述等效边长阈值,则将所述增强目标区域至少一次黏贴在所述原始数据样本图像中,获取带有增强目标区域的原始数据样本。还需要说明的是,所述如果超过所述等效边长阈值,则采用所述增强目标区域替换原始数据样本的目标区域,获取带有增强目标区域的原始数据样本的步骤,还包括:获取遮挡块属性信息;根据所述遮挡块属性信息,对所述增强目标区域进行随机遮挡,获取遮挡后的增强目标区域;采用所述遮挡后的增强目标区域替换原始数据样本的目标区域,获取带有增强目标区域的原始数据样本。本专利技术的第二实施方式涉及一种数据扩充装置。如图2所示。该装置包括:预设单元201,用于设置匹配阈值;信息获取单元202,用于获取带标注的原始数据集及其对应目标集合;目标获取单元203,用于根据所述匹配阈值,获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域;增强单元204,用于对所述目标区域进行数据增强处理,获取增强目标区域;样本信息获取单元205,用于将所述增强目标区域添加到所述当前原始数据中,获取带有增强目标区域的原始数据样本。需要说明的是,所述信息获取单元,还用于获取带标注的原始数据集及待检测目标信息;根据所述待检测目标信息,从所述带标注的原始数据集,获取所述目标集合;所述目标集合包括:所述待检测目标类别,高和宽。还需要说明的是,该装置还包括:平滑处理单元,用于对所述增强目标区域的图像边缘进行平滑处理。还需要说明的是,所述样本信息获取单元,还用于设置等效边长阈值;判断所述当前原始数据中的目标区域的等效边长是否超过所述等效边长阈值;如果超过所述等效边长阈值,则采用所述增强目标区域替换原始数据样本的目标区域,获取带有增强目标区域的原始数据样本;如果不超过所述等效边长阈值,则将所述增强目标区域至少一次黏贴在所述原始数据样本图像中,获取带有增强目标区域的原始数据样本。还需要说明的是,所述样本信息获取单元,还用于获取遮挡块属性信息;根据所述遮挡块属性信息,对所述增强目标区域进行随机遮挡,获取遮挡后的增强目标区域;采用所述遮挡后的增强目标区域替换原始数据样本的目标区域,获取带有增强目标区域的原始数据样本。不难发现,本实施方式为与第一实施方式相对应的装置实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应本文档来自技高网...

【技术保护点】
1.一种数据扩充方法,其特征在于,包括:/n设置匹配阈值;/n获取带标注的原始数据集及其对应目标集合;/n根据所述匹配阈值,获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域;/n对所述目标区域进行数据增强处理,获取增强目标区域;/n将所述增强目标区域添加到所述当前原始数据中,获取带有增强目标区域的原始数据样本。/n

【技术特征摘要】
1.一种数据扩充方法,其特征在于,包括:
设置匹配阈值;
获取带标注的原始数据集及其对应目标集合;
根据所述匹配阈值,获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域;
对所述目标区域进行数据增强处理,获取增强目标区域;
将所述增强目标区域添加到所述当前原始数据中,获取带有增强目标区域的原始数据样本。


2.根据权利要求1所述的数据扩充方法,其特征在于,所述获取带标注的原始数据集及其对应目标集合的步骤,包括:
获取带标注的原始数据集及待检测目标信息;
根据所述待检测目标信息,从所述带标注的原始数据集,获取所述目标集合;所述目标集合包括:所述待检测目标类别,宽和高。


3.根据权利要求2所述的数据扩充方法,其特征在于,该方法还包括:
对所述增强目标区域的图像边缘进行平滑处理。


4.根据权利要求2或3所述的数据扩充方法,其特征在于,所述将所述增强目标区域添加到所述当前原始数据中,获取带有增强目标区域的原始数据样本的步骤包括:
设置等效边长阈值;
判断所述当前原始数据中的目标区域的等效边长是否超过所述等效边长阈值;
如果超过所述等效边长阈值,则采用所述增强目标区域替换原始数据样本的目标区域,获取带有增强目标区域的原始数据样本;
如果不超过所述等效边长阈值,则将所述增强目标区域至少一次黏贴在所述原始数据样本图像中,获取带有增强目标区域的原始数据样本。


5.根据权利要求4所述的数据扩充方法,其特征在于,所述如果超过所述等效边长阈值,则采用所述增强目标区域替换原始数据样本的目标区域,获取带有增强目标区域的原始数据样本的步骤,还包括:
获取遮挡块属性信息;
根据所述遮挡块属性信息,对所述增强目标区域进行随机遮挡,获取遮挡后的增强目标区域;
采用所述遮挡后的增强...

【专利技术属性】
技术研发人员:邱石马文华宋君陶海
申请(专利权)人:北京文安智能技术股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1