【技术实现步骤摘要】
一种太赫兹人体安检图像目标检测模型训练数据增广方法
本专利技术涉及太赫兹人体安检图像处理
,具体涉及一种太赫兹人体安检图像目标检测模型训练数据增广方法。
技术介绍
目标检测能够从图像中分类和定位出兴趣目标,是计算机视觉中常见任务,深度学习是当前主要采用的解决方案。太赫兹人体安检图像可疑物目标检测属于特定应用领域,任务目标是通过人体安检图像发现和定位出人体衣物下被藏匿的可疑物品,但实际模型训练中存在可疑物样本稀缺,数据获取成本高,整体样本分布非常不均衡等问题,会导致目标检测模型训练效果不佳和检测准确率低。上述问题亟待解决,为此,提出一种太赫兹人体安检图像目标检测模型训练数据增广方法。
技术实现思路
本专利技术所要解决的技术问题在于:如何克服太赫兹安检图像可疑物标签数据少和样本不均衡问题,提供了一种太赫兹人体安检图像目标检测模型训练数据增广方法,该方法能够依据各类别可疑物标签数量占比,完成定向数据增广,提升目标检测模型的检测准确率。本专利技术是通过以下技术方案解决上述技术问题的,本专利技
【技术保护点】
1.一种太赫兹人体安检图像目标检测模型训练数据增广方法,其特征在于,包括以下步骤:/nS1:准备阶段/nS11:利用可疑物标注框从目标检测数据集中裁剪出增广数据子集,统计每类可疑物标签数量和占比,并计算增广命中百分比;/nS12:利用人工标注或者利用语义分割模型标记训练数据集中训练样本的人体前景区域,制作分割标注数据;/nS2:训练阶段/nS21:加载单张训练图像数据、目标检测标注数据、分割人体前景语义标签数据,增广计数器设置为1;/nS22:利用人体框标注,计算出被覆盖区域随机起始点坐标,增广计数器加1,如果达到次数上限,放弃增广,直接将图像数据和目标检测标注数据送入网络 ...
【技术特征摘要】
1.一种太赫兹人体安检图像目标检测模型训练数据增广方法,其特征在于,包括以下步骤:
S1:准备阶段
S11:利用可疑物标注框从目标检测数据集中裁剪出增广数据子集,统计每类可疑物标签数量和占比,并计算增广命中百分比;
S12:利用人工标注或者利用语义分割模型标记训练数据集中训练样本的人体前景区域,制作分割标注数据;
S2:训练阶段
S21:加载单张训练图像数据、目标检测标注数据、分割人体前景语义标签数据,增广计数器设置为1;
S22:利用人体框标注,计算出被覆盖区域随机起始点坐标,增广计数器加1,如果达到次数上限,放弃增广,直接将图像数据和目标检测标注数据送入网络训练;
S23:依据可疑物类别标签数量占比,从增广数据子集中随机挑选出一张增广覆盖图片;
S24:计算被覆盖区域与人体前景区域像素占比μ,被覆盖区域与所有可疑物目标框交并比σ的最大值,如果μ和σ满足设定的合格条件,则转入步骤S25,如果不满足则返回步骤S22;
S25:利用增广子集图片覆盖原图,修改训练图片标注数据,送入网络进行训练。
2.根据权利要求1所述的一种太赫兹人体安检图像目标检测模型训练数据增广方法,其特征在于:在所述步骤S11中,每张图像均存在标签(x1,y1,x2,y2,c),其中x1,y1是目标框左上角点坐标,(x2,y2)是目标框右下角点坐标,c是框中目标类别。
3.根据权利要求2所述的一种太赫兹人体安检图像目标检测模型训练数据增广方法,其特征在于:裁剪方式为利用可疑物标注框仅提取原始图像上[y1:y2,x1:x2]范围内图像数据,即仅裁剪图像中可疑物类别物品的区域;并统计可疑物目标框标签总数和各类别可疑物标签数量,计算各类别在总数中占比:其中Ci是第i类可疑物标签数量;计算对应倒数统计倒数占比其中γi是每类可疑物随机增广的概率,标签数量少的可疑物品被增广的概率大,标签数量多的可疑物品被增广的概率小。
4.根据权利要求3所述的一种太赫兹人体安检图像目标检测模型训练数据增广方法,其特征在于:在所述步骤S12中,需要为每张包含人体框的图像...
【专利技术属性】
技术研发人员:李诚,柳桃荣,余开,涂昊,刘泽鑫,
申请(专利权)人:博微太赫兹信息科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。