【技术实现步骤摘要】
一种基于宠物检测的二层标注的网络结构的设计方法
[0001]本专利技术涉及神经网络领域,特别涉及一种基于宠物检测的二层标注的网络结构的设计方法。
技术介绍
[0002]当今社会,人工智能领域中神经网络技术发展迅猛。其中MTCNN技术也是近年来较为流行的技术之一。MTCNN,Multi-task convolutional neural network(多任务卷积神经网络),将人脸区域检测与人脸关键点检测放在了一起,总体可分为P-Net、R-Net、和O-Net三层网络结构。用于人脸检测任务的多任务神经网络模型,该模型主要采用了三个级联的网络,采用候选框加分类器的思想,进行快速高效的人脸检测。这三个级联的网络分别是快速生成候选窗口的P-Net、进行高精度候选窗口过滤选择的R-Net和生成最终边界框与人脸关键点的O-Net。
[0003]但是,MTCNN级联检测存在以下缺陷:
[0004]现有对于其他物体检测训练中,使用的损失函数计算是计算类别和box,只有一个标注。只有一个类别的标注,对于宠物的标注,由于宠物的多样性,在计算整个网络回归时,受到背景影响比较大,导致训练难度增大,不容易收敛,训练的模型也很差,正确率和召回率很低。
[0005]此外,现有技术中还包括以下常用的技术术语:
[0006]1、网络结构级联:是指几个检测器通过串联的方式进行检测的方式称为级联。
[0007]2、卷积核:卷积核是用来做图像处理时的矩阵,与原图像做运算的参数。卷积核通常是一个列矩阵数组成(例如3*
【技术保护点】
【技术特征摘要】
1.一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述方法包括以下步骤:S1,样本的标注:样本采用宠物上半身标注和宠物头部标注;S2,标注在训练中的使用:S2.1,第一级标注,训练中使用的标注是根据网络结构进行标注,将宠物上半身外接矩形按最大边为边长充成正方形,在这个正方形中,以正方形四分之一的大小,以边长的1/4为步长,按从左到右、从上到下移动生成9个小正方形;宠物头所在的小正方形的位置标注为1,其他没有宠物头部的小正方形标注为0,生成一向量,这个向量就是相对宠物上半身中宠物头的标注信息;S2.2,第二级标注,宠物上半身标注为1;S3,设计采用二级级联检测方法的网络结构:S3.1,第一级网络:共七层,前四层和第六层、第七层的卷积核均是3
×
3,第五层的卷积核大小为1
×
1;S3.2,第二级网络:共八层,前五层和第七层、第八层的卷积核均是3
×
3,第六层的卷积核大小为1
×
1。2.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述步骤S1中宠物上半身是从头到宠物的前胸部,宠物头部标注是以头的外接矩形为标注信息。3.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述步骤S2.1中,所述小正方形依次编号为1、2、3、4、5、6、7、8、9。4.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,当有多个宠物很密集时,会出现一个宠物上半身N个宠物头,N为大于等于2的自然数,此时会出现一个向量中有N个1的情况;当宠物低头并且背对镜头时,会出现宠物头的向量是全零的情况。5.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述步骤S2.1中生成一向量,当宠物头位于编号2的小正方形时,生成向量为[0,1,0,0,0,0,0,0,0],依次类推,宠物头位于哪个编号的小正方形,向量中对应哪个标注为1。6.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述步骤S2在训练中,宠物上半身外接矩形和类别的标注方法使用MTCNN的算法。7.根据权利要求1所述的一种基于宠物检测的二层标注的网络结构的设计方法,其特征在于,所述步骤S3.1,第一级网络,进一步包括:第一层输入灰度图33
×
33
×
1,步长是1,输出深度是16,输出结果特征图(1)31
×
31
×
16;第二层输入特征图(1)31
×
31
×
16,步长是2,输出深度是16,输出结果是特征图(2)15
×
1...
【专利技术属性】
技术研发人员:田凤彬,于晓静,
申请(专利权)人:北京君正集成电路股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。