一种基于宠物检测的二层标注的网络结构的设计方法技术

技术编号:30883662 阅读:15 留言:0更新日期:2021-11-22 20:21
本发明专利技术提供一种基于宠物检测的二层标注的网络结构的设计方法,包括:S1样本的标注:样本采用宠物上半身标注和宠物头部标注;S2标注在训练中的使用:S2.1第一级标注,训练中使用的标注是根据网络结构进行标注,宠物头所在的小正方形的位置标注为1,其他没有宠物头部的小正方形标注为0,生成一向量,这个向量就是相对宠物上半身中宠物头的标注信息;S2.2第二级标注,宠物上半身标注为1;S3设计采用二级级联检测方法的网络结构:S3.1第一级网络:共七层,前四层和第六层、第七层的卷积核均是3

【技术实现步骤摘要】
一种基于宠物检测的二层标注的网络结构的设计方法


[0001]本专利技术涉及神经网络领域,特别涉及一种基于宠物检测的二层标注的网络结构的设计方法。

技术介绍

[0002]当今社会,人工智能领域中神经网络技术发展迅猛。其中MTCNN技术也是近年来较为流行的技术之一。MTCNN,Multi-task convolutional neural network(多任务卷积神经网络),将人脸区域检测与人脸关键点检测放在了一起,总体可分为P-Net、R-Net、和O-Net三层网络结构。用于人脸检测任务的多任务神经网络模型,该模型主要采用了三个级联的网络,采用候选框加分类器的思想,进行快速高效的人脸检测。这三个级联的网络分别是快速生成候选窗口的P-Net、进行高精度候选窗口过滤选择的R-Net和生成最终边界框与人脸关键点的O-Net。
[0003]但是,MTCNN级联检测存在以下缺陷:
[0004]现有对于其他物体检测训练中,使用的损失函数计算是计算类别和box,只有一个标注。只有一个类别的标注,对于宠物的标注,由于宠物的多样性,在计算整个网络回归时,受到背景影响比较大,导致训练难度增大,不容易收敛,训练的模型也很差,正确率和召回率很低。
[0005]此外,现有技术中还包括以下常用的技术术语:
[0006]1、网络结构级联:是指几个检测器通过串联的方式进行检测的方式称为级联。
[0007]2、卷积核:卷积核是用来做图像处理时的矩阵,与原图像做运算的参数。卷积核通常是一个列矩阵数组成(例如3*3的矩阵),该区域上每个方格都有一个权重值。矩阵形状一般是1
×
1,3
×
3,5
×
5,7
×
7,1
×
3,3
×
1,2
×
2,1
×
5,5
×
1,
……
[0008]3、卷积:将卷积核的中心放置在要计算的像素上,一次计算核中每个元素和其覆盖的图像像素值的乘积并求和,得到的结构就是该位置的新像素值,这个过程称为卷积。
[0009]4、激励函数:一种对卷积后结果进行处理的一种函数。
[0010]5、特征图:输入数据通过卷积计算后得到的结果称之为特征图,数据通过全连接后生成的结果也称为特征图。特征图大小一般表示为长
×

×
深度,或1
×
深度
[0011]6、步长:卷积核中心位置再坐标上移动的长度。
[0012]7、两端非对齐处理:图像或数据通过卷积核大小为3
×
3处理时,如果不够一个卷积核处理,会导致两侧数据不够,此时采用丢弃两侧或一侧数据,这种现象叫做两端非对其处理。
[0013]8、损失计算级联:是指在网络结构某个节点进行计算损失值,并将该损失值加权计算到整体损失中,这种计算损失值的方法叫做损失计算级联。
[0014]9、损失函数(loss function)也叫代价函数(cost function)。是神经网络优化的目标函数,神经网络训练或者优化的过程就是最小化损失函数的过程(损失函数值小了,对应预测的结果和真实结果的值就越接近。
[0015]10、范数(norm),是具有“长度”概念的函数。

技术实现思路

[0016]为了解决上述现有技术存在的问题,本专利技术的目的在于:对宠物类别的标注使用两个标注信息,网络结构对应采用独特的网络结构。这样会消除宠物多样性对目标的影响。
[0017]具体地,本专利技术提供一种基于宠物检测的二层标注的网络结构的设计方法,所述方法包括以下步骤:
[0018]S1,样本的标注:样本采用宠物上半身标注和宠物头部标注;
[0019]S2,标注在训练中的使用:
[0020]S2.1,第一级标注,训练中使用的标注是根据网络结构进行标注,将宠物上半身外接矩形按最大边为边长充成正方形,在这个正方形中,以正方形四分之一的大小,以边长的1/4为步长,按从左到右、从上到下移动生成9个小正方形;宠物头所在的小正方形的位置标注为1,其他没有宠物头部的小正方形标注为0,生成一向量,这个向量就是相对宠物上半身中宠物头的标注信息;
[0021]S2.2,第二级标注,宠物上半身标注为1;
[0022]S3,设计采用二级级联检测方法的网络结构:
[0023]S3.1,第一级网络:共七层,前四层和第六层、第七层的卷积核均是3
×
3,第五层的卷积核大小为1
×
1;
[0024]S3.2,第二级网络:共八层,前五层和第七层、第八层的卷积核均是3
×
3,第六层的卷积核大小为1
×
1。
[0025]所述步骤S1中,宠物上半身是从头到宠物的前胸部,宠物头部标注是以头的外接矩形为标注信息;
[0026]所述步骤S2.1中,所述小正方形依次编号为1、2、3、4、5、6、7、8、9。
[0027]当有多个宠物很密集时,会出现一个宠物上半身N个宠物头,N为大于等于2的自然数,此时会出现一个向量中有N个1的情况;当宠物低头并且背对镜头时,会出现宠物头的向量是全零的情况。
[0028]所述步骤S2.1中生成一向量,当宠物头位于编号2的小正方形时,生成向量为[0,1,0,0,0,0,0,0,0],依次类推,宠物头位于哪个编号的小正方形,向量中对应哪个标注为1。
[0029]所述步骤S2在训练中,宠物上半身外接矩形和类别的标注方法使用MTCNN的算法。
[0030]所述步骤S3.1,第一级网络,进一步包括:
[0031]第一层输入灰度图33
×
33
×
1,步长是1,输出深度是16,输出结果特征图(1)31
×
31
×
16;
[0032]第二层输入特征图(1)31
×
31
×
16,步长是2,输出深度是16,输出结果是特征图(2)15
×
15
×
16;
[0033]第三层输入数据特征图(2)15
×
15
×
16,步长是2,输出深度是16,输出结果是特征图(3)7
×7×
16;
[0034]第四层输入数据特征图(3)7
×7×
16,步长是2,输出深度是16,输出结果是特征图(4)3
×3×
16;
[0035]第五层输入数据特征图(4)3
×3×
16,步长是1,输出深度是1,输出结果是特征图
(5)3
×3×
1;
[0036]第六层输入数据特征图(4)3
×3×
16,步长是1,输出深度是4,输出结果是特征图(6)1
×1×
4;...

【技术保护点】

【技术特征摘要】
1.一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述方法包括以下步骤:S1,样本的标注:样本采用宠物上半身标注和宠物头部标注;S2,标注在训练中的使用:S2.1,第一级标注,训练中使用的标注是根据网络结构进行标注,将宠物上半身外接矩形按最大边为边长充成正方形,在这个正方形中,以正方形四分之一的大小,以边长的1/4为步长,按从左到右、从上到下移动生成9个小正方形;宠物头所在的小正方形的位置标注为1,其他没有宠物头部的小正方形标注为0,生成一向量,这个向量就是相对宠物上半身中宠物头的标注信息;S2.2,第二级标注,宠物上半身标注为1;S3,设计采用二级级联检测方法的网络结构:S3.1,第一级网络:共七层,前四层和第六层、第七层的卷积核均是3
×
3,第五层的卷积核大小为1
×
1;S3.2,第二级网络:共八层,前五层和第七层、第八层的卷积核均是3
×
3,第六层的卷积核大小为1
×
1。2.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述步骤S1中宠物上半身是从头到宠物的前胸部,宠物头部标注是以头的外接矩形为标注信息。3.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述步骤S2.1中,所述小正方形依次编号为1、2、3、4、5、6、7、8、9。4.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,当有多个宠物很密集时,会出现一个宠物上半身N个宠物头,N为大于等于2的自然数,此时会出现一个向量中有N个1的情况;当宠物低头并且背对镜头时,会出现宠物头的向量是全零的情况。5.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述步骤S2.1中生成一向量,当宠物头位于编号2的小正方形时,生成向量为[0,1,0,0,0,0,0,0,0],依次类推,宠物头位于哪个编号的小正方形,向量中对应哪个标注为1。6.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述步骤S2在训练中,宠物上半身外接矩形和类别的标注方法使用MTCNN的算法。7.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述步骤S3.1,第一级网络,进一步包括:第一层输入灰度图33
×
33
×
1,步长是1,输出深度是16,输出结果特征图(1)31
×
31
×
16;第二层输入特征图(1)31
×
31
×
16,步长是2,输出深度是16,输出结果是特征图(2)15
×
1...

【专利技术属性】
技术研发人员:田凤彬于晓静
申请(专利权)人:北京君正集成电路股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1