一种数据扩充方法及装置制造方法及图纸

技术编号：24168554 阅读：30 留言：0更新日期：2020-05-16 02:12

本发明专利技术涉及人工智能技术领域，公开了一种数据扩充方法及装置。该方法包括：设置匹配阈值；获取带标注的原始数据集及其对应目标集合；根据所述匹配阈值，获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域；对所述目标区域进行数据增强处理，获取增强目标区域；将所述增强目标区域添加到所述当前原始数据中，获取带有增强目标区域的原始数据样本。采用本发明专利技术技术方案不但可以对个性化问题进行针对性数据扩充，且成本不高。

A data expansion method and device

全部详细技术资料下载

【技术实现步骤摘要】
一种数据扩充方法及装置
本专利技术涉及人工智能
，特别涉及一种数据扩充方法及装置。
技术介绍
随着人工智能和计算机技术的发展，深度学习被广泛应用于人们的生产和生活中。通过大量数据的训练，深度学习在分类，目标检测等方面明显优于传统方法。然而，数据收集难度较大，尤其是小样本数据，收集周期较长，时间成本较高。另外，数据标注工作量繁重，需要大量成熟标注员长期标注，人力成本较高，标注效果和效率和标注员的标注水平相关度较大这也增加了数据标注的不确定性。因此，基于现有数据进行数据扩充，用于模拟现实场景变得尤为重要。在现有技术的实现过程中，专利技术人发现现有技术至少存在如下技术问题：现有技术中，数据扩充并未对个性化问题进行针对性数据扩充，使得数据扩充方法效果不加，且数据扩充成本较高。
技术实现思路
本专利技术的目的在于提供一种数据扩充方法及装置，以克服现有技术中的缺陷。为解决上述技术问题，本专利技术的实施方式提供了一种数据扩充方法，包括：设置匹配阈值；获取带标注的原始数据集及其对应目标集合；根据所述匹配阈值，获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域；对所述目标区域进行数据增强处理，获取增强目标区域；将所述增强目标区域添加到所述当前原始数据中，获取带有增强目标区域的原始数据样本。为解决上述技术问题，本专利技术的实施方式还提供了一种数据扩充装置，包括：预设单元，用于设置匹配阈值；信息获取...

【技术保护点】
1.一种数据扩充方法，其特征在于，包括：/n设置匹配阈值；/n获取带标注的原始数据集及其对应目标集合；/n根据所述匹配阈值，获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域；/n对所述目标区域进行数据增强处理，获取增强目标区域；/n将所述增强目标区域添加到所述当前原始数据中，获取带有增强目标区域的原始数据样本。/n

【技术特征摘要】
1.一种数据扩充方法，其特征在于，包括：
设置匹配阈值；
获取带标注的原始数据集及其对应目标集合；
根据所述匹配阈值，获取所述带标注的原始数据集中当前原始数据在所述目标集合中对应的目标区域；
对所述目标区域进行数据增强处理，获取增强目标区域；
将所述增强目标区域添加到所述当前原始数据中，获取带有增强目标区域的原始数据样本。

2.根据权利要求1所述的数据扩充方法，其特征在于，所述获取带标注的原始数据集及其对应目标集合的步骤，包括：
获取带标注的原始数据集及待检测目标信息；
根据所述待检测目标信息，从所述带标注的原始数据集，获取所述目标集合；所述目标集合包括：所述待检测目标类别，宽和高。

3.根据权利要求2所述的数据扩充方法，其特征在于，该方法还包括：
对所述增强目标区域的图像边缘进行平滑处理。

4.根据权利要求2或3所述的数据扩充方法，其特征在于，所述将所述增强目标区域添加到所述当前原始数据中，获取带有增强目标区域的原始数据样本的步骤包括：
设置等效边长阈值；
判断所述当前原始数据中的目标区域的等效边长是否超过所述等效边长阈值；
如果超过所述等效边长阈值，则采用所述增强目标区域替换原始数据样本的目标区域，获取带有增强目标区域的原始数据样本；
如果不超过所述等效边长阈值，则将所述增强目标区域至少一次黏贴在所述原始数据样本图像中，获取带有增强目标区域的原始数据样本。

5.根据权利要求4所述的数据扩充方法，其特征在于，所述如果超过所述等效边长阈值，则采用所述增强目标区域替换原始数据样本的目标区域，获取带有增强目标区域的原始数据样本的步骤，还包括：
获取遮挡块属性信息；
根据所述遮挡块属性信息，对所述增强目标区域进行随机遮挡，获取遮挡后的增强目标区域；
采用所述遮挡后的增强...

【专利技术属性】
技术研发人员：邱石，马文华，宋君，陶海，
申请(专利权)人：北京文安智能技术股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人