一种基于多轴交叉注意的不良图片鉴别方法技术

技术编号:36188940 阅读:13 留言:0更新日期:2022-12-31 20:59
本发明专利技术公开了一种基于多轴交叉注意的不良图片鉴别方法,包含构建浅层特征提取模块,构建多轴交叉注意感知网络,构建区域全连接卷积识别网络,构建多轴交叉注意感知的不良图片鉴别网络,构建深度优化器,获得深度网络的最优参数,根据最优网络参数,获得不良图片的评估值。本发明专利技术可有效提高不良图片的识别率、简单有效,处理时间较短,可以达到实时。可以达到实时。可以达到实时。

【技术实现步骤摘要】
一种基于多轴交叉注意的不良图片鉴别方法


[0001]本专利技术应用于神经网络安全背景,名称是一种基于多轴交叉注意的不良图片鉴别方法。

技术介绍

[0002]近年来,随着便携设备逐渐普及,尤其智能手机的广泛应用,上网人数越来越多,尤其未成年人上网人数也逐年增多,占比非常高。未成年人由于没有建立良好的价值观,非常容易收到网络不良信息的影响,尤其受到不良图片的影响更甚,对未成年人的生活及学习产生十分不良的影响。为了还给一个健康的未成年人网络,国家也制定一系列法律法规,打击不良图片的传播和存贮。但随着移动网络的快速发展,也进一步加快了数字图片的传播速度,其中不良图片也快速增长,为了能有效快速鉴别不良图片,目前许多研究者也提出了多种有效的检测方法,粗略可以分为两类:一类是传统的检测方法,利用传统的特征提取和分类器对不良图片进行判断,另一类是结合目前比较热的人工智能方法进行不良图片分类和鉴别。
[0003]传统的检测方法是通过对不良图片中裸露肤色信息进行特征提取,然后结合传统的分类方法进行判断,如支持向量机、决策树和聚类算法,该类算法最大特点就是对裸露区域进行了数学建模,常用的有YCbCr颜色空间皮肤像素定义法,高斯建模法和贝叶斯统计模型等。但该类方法容易对与泳装、内衣模特等正常图片产生大量误判。为了进一步降低误判率,有的研究者通过利用人脸肤色辅助检测皮肤肤色,从而提高了检测的精度,降低了误判率,还有的研究者通过引入一些人体敏感部位的先验信息进行检测,从而提高检测的精度和可靠性。
[0004]这些传统的检测方法容易受到特征提取和分类器的选择的影响,提取的特征越有效,分类器选择的越好,检测的精度就越高。但对于复杂的不良图片,很难提取有效的视觉特征,以及很难采用一种检测精度高的分类器。为了提高检测的精度,许多结合深度学习的检测算法提出来。目前基于深度学习的识别算法主要有LeNet、AlexNetResNet,fasterrcnn和Yolo系列,解决了有效特征提取的问题,也有不少不良图检测算法是以这些深度学习框架作为骨架,提高了检测精度。但这些检测算法都是基于大量的标注数据和大量的训练时间完成的,同时对于复杂的隐蔽的不良图片的检测效果也不是很理想。随着视觉感知引入到深度网络中,提取的视觉特征的表征能里也越来越强。目前视觉感知主要有通道感知、空间注意感知、时空注意感知和混合感知,每种感知都从不同方面增强了视觉特征表征能力,为了能全面利用不同视觉感知,有些研究者通过结合级联、并行不同视觉感知的方式提取视觉特征。但这些方式不能充分利用这些感知全部能力。为了进一步提高特征表征能力,本专利技术提出了一种新的多轴交叉注意感知,该感知在卷积神经网络的基础上,更加有效低获取表征能力强的视觉特征,结合这些特征,利用区域全连接模块完成不良图片的鉴别。

技术实现思路

[0005]针对现有不良图片检测技术中存在检测率低的问题,本专利技术提供了一种基于多轴交叉注意的不良图片鉴别方法,可有效提高不良图片的检测精度,降低误判率。该方法简单有效,处理时间较短,可以达到实时检测不良图片。
[0006]为了解决上述技术问题,本专利技术提供如下技术方案:一种基于多轴交叉注意的不良图片鉴别方法,步骤包括:
[0007]构建浅层特征提取模块;构建多轴交叉注意感知网络;构建区域全连接卷积识别网络构建多轴交叉注意感知的不良图片鉴别网络;构建深度优化器,获得深度网络的最优参数,根据最优网络参数,获得不良图片的评估值。
[0008]在一个实施例中,所述构建浅层特征提取模块(SFAM),该模块通过对不同通道的不同接受域的信息融合,提取不良图片和对应的梯度图片的浅层视觉特征,为下一步多轴交叉注意模块处理提供有效的视觉信息。所述SFAM模块由5个带有不同核大小的卷积模块、3个不同核大小的池化模块,以及2个级联操作,如图2所示,其中,长方体侧面标注的是核的大小,pool表示池化操作,C表示级联操作,fi表示第i个视觉特征。从数学上具体可表示为:
[0009]f1=ConvB(Input,5)
[0010]f2=ConvB(f1,3)
[0011]f3=C(f1,Pool(f2,7))
[0012]f4=C(f2,Pool(ConvB(f3,3),5))
[0013]f5=Conv(Pool(ConvB(f4,3),3),1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0014]其中,ConvB(fi,k)表示含有1个卷积层,1个激活层的卷积块,k表示卷积核的大小,在本专利技术中,k取值为1,3,5,7;Input表示输入图像,在本专利技术中是不良图片和对应的梯度图像;C(,)表示两个视觉按照通道维度进行级联,Pool(fi,k)表示平均池化操作,k也表示卷积核的大小。
[0015]在一个实施例中,所述构建多轴交叉注意感知网络(MACA)包括三个部分选择注意感知网络(SA)、全局池化通道感知网络(GPCA)和交叉感知网络。选择注意网络感知通过全局平均池化层(GAP),全连接层(FC),激活函数(Softmax)以及若个操作完成的,其通过注意网络后获取的视觉特征Fsa可以表示为:
[0016][0017]a=Softmax(FC(GAP(F
a
)))
[0018][0019]其中,F
i
(i∈{1,2,3})是通过切分操作(split)切分出来的,a
i
(i∈{1,2,3})表示经过激活函数softmax操作后获得权重a的第i个分量。表示像素级的视觉特征求和操作.全局池化通道感知网络首先对两个不同的视觉特征进行级联,然后利用卷积核为1的卷积层将视觉特征通道数降低,紧接着计算降低后特征的通道相关系数,紧着对获取的系数矩阵进行行卷积操作,接着再通过一系列的全连接和激活操作获得对应特征通道的权重,最后通过将这些通道权重与对应通道的视觉特征相乘得到新的视觉特征。具体通过数学表示可以表达为:
[0020]x
cat
=Conv1
×
1(C(x1,x2))
[0021]F
gp
=σ(FC(rwconv(Cov(x
cat
))))
×
x
cat
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0022]其中,Conv1x1表示卷积核为1的卷积操作,C(x1,x2)表示两个不同输入视觉特征x1,x2的级联操作,x
cat
表示经过卷积核为1的卷积操作后的视觉特征,Cov表示视觉特征x
cat
的通道相关系数矩阵,rwconv表示行级的卷积操作,FC同样表示全连接操作,σ表示sigmoid函数。
[0023]选择注意感知网络(SA)和全局池化通道感知网络(GPCA)构建完成后,紧接着依次利用这两个子网络交叉提取特征,然后分别进行卷核为3的卷积操作,并各自进行短链接后再级联,最本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多轴交叉注意的不良图片鉴别方法,包括如下所述步骤:构建浅层特征提取模块;构建多轴交叉注意感知网络;构建区域全连接卷积识别网络构建多轴交叉注意感知的不良图片鉴别网络构建深度优化器,获得深度网络的最优参数,根据最优网络参数,获得不良图片的评估值。2.根据权利要求1所述的一种基于多轴交叉注意的不良图片鉴别方法,其特征在于:所述构建浅层特征提取模块(SFAM),该模块通过对不同通道的不同接受域的信息融合,提取不良图片和对应的梯度图片的浅层视觉特征,为下一步多轴交叉注意模块处理提供有效的视觉信息。所述SFAM模块由5个带有不同核大小的卷积模块、3个不同核大小的池化模块,以及2个级联操作,如图2所示,其中,长方体侧面标注的是核的大小,pool表示池化操作,C表示级联操作,fi表示第i个视觉特征。从数学上具体可表示为:f1=ConvB(Input,5)f2=ConvB(f1,3)f3=C(f1,Pool(f2,7))f4=C(f2,Pool(ConvB(f3,3),5))f5=Conv(Pool(ConvB(f4,3),3),1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,ConvB(fi,k)表示含有1个卷积层,1个激活层的卷积块,k表示卷积核的大小,在本发明中,k取值为1,3,5,7;Input表示输入图像,在本发明中是不良图片和对应的梯度图像;C(,)表示两个视觉按照通道维度进行级联,Pool(fi,k)表示平均池化操作,k也表示卷积核的大小。3.根据权利要求1所述的一种基于多轴交叉注意的不良图片鉴别方法,其特征在于:所述构建多轴交叉注意感知网络(MACA)包括三个部分选择注意感知网络(SA)、全局池化通道感知网络(GPCA)和交叉感知网络。选择注意网络感知通过全局平均池化层(GAP),全连接层(FC),激活函数(Softmax)以及若个操作完成的,其通过注意网络后获取的视觉特征Fsa可以表示为:a=Softmax(FC(GAP(F
a
)))其中,F
i
(i∈{1,2,3})是通过切分操作(split)切分出来的,a
i
(i∈{1,2,3})表示经过激活函数softmax操作后获得权重a的第i个分量。表示像素级的视觉特征求和操作.全局池化通道感知网络首先对两个不同的视觉特征进行级联,然后利用卷积核为1的卷积层将视觉特征通道数降低,紧接着计算降低后特征的通道相关系数,紧着对获取的系数矩阵进行行卷积操作,接着再通过一系列的全连接和激活操作获得对应特征通道的权重,最后通过将这些通道权重与对应通道的视觉特征相乘得到新的视觉特征。具体通过数学表示可以表达为:
x
cat
=Conv1
×
1(C(x1,x2))F
gp
=σ(FC(rwconv(Cov(x
cat
))))
×
x
cat
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,Conv1x1表示卷积核为1的卷积操作,C(x1,x2)表示两个不同输入视觉特征x1,x2的级联操作,x
cat
表示经过卷积核为1的卷积操作后的视觉特征,Cov表示视觉特征x
cat
的通道相关系数矩阵,rwconv表示行级的卷积操作,FC同样表示全连接操作,σ表示sigmoid函数。选择注意感知网络(SA)和全局池化通道感知网络(GPCA)构建完成后,紧接着依次利用这两个子网络交叉提取特征,然后分别进行卷核为3的卷积操作,并各自进行短链接后再级联,最后结合卷积核为1的卷积操作进行特征融合,形成更加有效的视觉特征。具体可以表示为:F
X
=GPCA(SA(X),Y)F
Y
=GPCA(SA(Y),X)=GPCA(SA(Y),X)F
c
=Conv1x1(C(F
cX
,F
CY
))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中SA(.)和GPCA(.)分别表示通过注意感知网络和全局池化通道感知网络,F
X
和F
Y
分别表示经过这两个网络后的视觉特征,F
cX
表示F
X
经过...

【专利技术属性】
技术研发人员:高伟贡伟力郭强王奋
申请(专利权)人:江苏理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1