【技术实现步骤摘要】
一种轻量级的文身检测方法
本专利技术属于计算机视觉领域。
技术介绍
随着互联网应用的快速发展,越来越多的人会选择在一些互联网应用上传图像或视频,不可避免的会出现违法违规的内容,以往需要雇佣大量的审核员人工仔细地检查这些内容,成本较高且易出错。近年来,随着人工智能技术的飞速发展,使用人工智能辅助工作人员进行互联网内容的审查是发展的必然趋势。图像中的文身在某些应用场景中是违规的,又因文身表观、大小差异极大,因此开发出适合文身图案检测的目标检测技术至关重要。在保证文身检测精度的同时,提升检测的速度,是文身检测技术落地的关键。为此,本专利技术提出一种轻量级的文身检测方法。与其他对象物检测相比,文身检测有以下挑战:首先,文身区域尺度变化大,文身既可以占满皮肤,处于整个背部,也可能只文在皮肤的局部区域;其次,文身的数据较少,并且获取困难,现有的数据集有限,在训练检测模型时会产生过拟合,从而导致模型学习效率低、鲁棒性差、泛化不足差等问题。这些问题使得将现有对象物检测方法直接应用在文身检测上难以获得满意的效果。在检测速度方面,现有目 ...
【技术保护点】
1.一种轻量级的文身检测方法,其特征在于,包括以下步骤:/n步骤1、数据准备阶段;/n训练数据包括两部分,一部分来自公开数据集,另一部分从互联网上爬取并进行手工标注包围框;/n步骤2、轻量级文身检测网络构建阶段;/nYOLOv5网络构建阶段,包括主干网络设计,Neck设计、head设计;/n(1)主干网络:使用的主干网络为CSPDarknet,称作跨阶段局部网络;主干网络使用的模块有:Focus、CBL、CSP;/nFocus:网络的输入为三通道的RGB图像,大小为480×480×3;该模块把原始输入图像进行切片,得到240×240×12的特征图,然后使用卷积操作得到240 ...
【技术特征摘要】
1.一种轻量级的文身检测方法,其特征在于,包括以下步骤:
步骤1、数据准备阶段;
训练数据包括两部分,一部分来自公开数据集,另一部分从互联网上爬取并进行手工标注包围框;
步骤2、轻量级文身检测网络构建阶段;
YOLOv5网络构建阶段,包括主干网络设计,Neck设计、head设计;
(1)主干网络:使用的主干网络为CSPDarknet,称作跨阶段局部网络;主干网络使用的模块有:Focus、CBL、CSP;
Focus:网络的输入为三通道的RGB图像,大小为480×480×3;该模块把原始输入图像进行切片,得到240×240×12的特征图,然后使用卷积操作得到240×240×32的特征图;
CBL:YOLOv5的基本模块,其结构为步长为2的3×3卷积、批归一化BN,激活函数Hardswish;Hardswish的公式为:
CSP:该模块输入分为两个分支,第一支包括一个CBL模块,多个残差单元和一个3×3卷积;第二支只有一个3×3卷积;
利用主干网络进行特征提取的具体流程为:
(一)尺度为480×480输入图像经过Focus模块,得到240×240×32的特征图;
(二)经过3组CBL+CSP组合,将特征图的尺度由240×240依次降低为120×120、60×60、30×30;
(三)最后经过一个CBL模块,得到尺度为15×15的特征图,作为SPP的输入;
(2)Neck:该模块的功能是构建特征金字塔,获得多尺度的信息;使用了SPP、FPN+PAN的结构;具体流程为:
A.SPP的输出的尺度为15×15特征的作为特征金字塔的顶层,然后将其上采样,与主干网络提取的30×30的特征图做堆叠融合,作为金字塔中层,然后中层特征分别再经过上采样与主干网络提取的60×60的特征图做堆叠融合,作为金字塔的底层,完成FPN的构建;
B.将FPN底层特征作为PAN的底层,再使用CBL将其依次下采样到30×30、15×15,分别于同尺度的FPN特征进行堆叠融合,从而得到PAN的中层上顶层,完成PAN的构建;
(3)Head:因为YOLOv5是多尺度的单阶段的目标检测方法,使用Head层从PAN特征图中选择三个尺度大小为15×15,30×...
【专利技术属性】
技术研发人员:卢闰霆,褚真,马文广,马伟,李冰,赵金,
申请(专利权)人:金科智融科技珠海有限公司,北京工业大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。