一种级联检测中分块优化的方法技术

技术编号:30491648 阅读:27 留言:0更新日期:2021-10-27 22:20
本发明专利技术提供一种级联检测中分块优化的方法,所述方法包括以下步骤:S1,将图像分为16块,图像宽的方向分为四块,高的方向分为四块,确定图像金字塔列表里的最后三个;S2,所述16块的分块标准及块移按以下公式计算:(INPUT_W-WLEN_W)/INC_W+1=FN_W 公式(1);(INPUT_H-WLEN_H)/INC_H+1=FN_H 公式(2);INC_W=(INPUT_W

【技术实现步骤摘要】
一种级联检测中分块优化的方法


[0001]本专利技术涉及神经网络领域,特别涉及一种级联检测中分块优化的方法。

技术介绍

[0002]人工智能领域中神经网络技术日益发展迅猛。其中MTCNN技术也是近年来较为流行的技术之一。MTCNN,Multi-task convolutional neural network(多任务卷积神经网络),将人脸区域检测与人脸关键点检测放在了一起,总体可分为P-Net、R-Net、和O-Net三层网络结构。用于人脸检测任务的多任务神经网络模型,该模型主要采用了三个级联的网络,采用候选框加分类器的思想,进行快速高效的人脸检测。这三个级联的网络分别是快速生成候选窗口的P-Net、进行高精度候选窗口过滤选择的R-Net和生成最终边界框与人脸关键点的O-Net。
[0003]但是,在现有技术中,也存在如下缺点:当前深度学习算法如果不依赖GPU或NPU等硬件加速处理器在嵌入式平台上纯粹靠CPU运行会非常吃力,客户体验也会非常不好,CPU占用率居高不下,落地困难。
[0004]此外,现有技术中常用的技术术语包括:
[0005]级联卷积网络:就是设计N阶网络,由粗到精对任务进行处理。
[0006]图像金字塔:就是将图像按一定尺度进行变换,以适应对不同大小的人脸进行检测。
[0007]最小检测大小:如果检测目标宽高小于最小检测大小,模型没有检测能力。

技术实现思路

[0008]为了解决上述问题,本专利技术的目的在于:通过本方法实现依靠CPU工作就能够降低CPU负载,提升用户体验。
[0009]具体地,本专利技术提供一种级联检测中分块优化的方法,所述方法包括以下步骤:
[0010]S1,将图像分为16块,图像宽的方向分为四块,高的方向分为四块,确定图像金字塔列表里的最后三个;
[0011]S2,所述16块的分块标准及块移按以下公式计算:
[0012](INPUT_W-WLEN_W)/INC_W+1=FN_W公式(1)
[0013](INPUT_H-WLEN_H)/INC_H+1=FN_H公式(2)
[0014]INC_W=(INPUT_W

MIN_OBJECT_SIZE)/FN_W公式(3)
[0015]其中,
[0016]INPUT_W/INPUT_H为输入图像的宽/高;
[0017]WLEN_W/WLEN_H为分块的宽/高长度;
[0018]INC_W/INC_H为块移;
[0019]FN_W/FN_H是在横向/纵向要分的块数;
[0020]MIN_OBJECT_SIZE为最小检测物体大小,其保证跨越两块之间的最小物体不漏检。
[0021]由此,本申请的优势在于:通过分块优化的方式使得级联检测中的效得到大幅提升,充分考虑到了大小目标的检测范围,且与整帧检测效果没有差异。
附图说明
[0022]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,并不构成对本专利技术的限定。
[0023]图1是本专利技术方法的示意流程图。
具体实施方式
[0024]为了能够更清楚地理解本专利技术的
技术实现思路
及优点,现结合附图对本专利技术进行进一步的详细说明。
[0025]如图1所示,本专利技术涉及
[0026]一种级联检测中分块优化的方法,所述方法包括以下步骤:
[0027]S1,将图像分为16块,图像宽的方向分为四块,高的方向分为四块,确定图像金字塔列表里的最后三个;
[0028]S2,所述16块的分块标准及块移按以下公式计算:
[0029](INPUT_W-WLEN_W)/INC_W+1=FN_W公式(1)
[0030](INPUT_H-WLEN_H)/INC_H+1=FN_H公式(2)
[0031]INC_W=(INPUT_W

MIN_OBJECT_SIZE)/FN_W公式(3)
[0032]其中,
[0033]INPUT_W/INPUT_H为输入图像的宽/高;
[0034]WLEN_W/WLEN_H为分块的宽/高长度;
[0035]INC_W/INC_H为块移;
[0036]FN_W/FN_H是在横向/纵向要分的块数;
[0037]MIN_OBJECT_SIZE为最小检测物体大小,其保证跨越两块之间的最小物体不漏检。
[0038]所述方法选取M*N分辨率的输入图像,其分辨率大小使得图像计算量占整体计算量至少在60%以上。
[0039]所述的M*N为640*360。
[0040]所述的图像计算量占整体计算量优选为70%以上。
[0041]最小检测物体大小MIN_OBJECT_SIZE为40;
[0042]INPUT_W=640
[0043]FN_W=4
[0044]根据公式(3)
[0045]INC_W=(640

40)/4=150
[0046]根据公式(1)
[0047]WLEN_W=190。
[0048]进一步同理:
[0049]INPUT_H=360
[0050]FN_H=4
[0051]根据公式(3)
[0052]INC_H=(360

40)/4=80
[0053]根据公式(1)
[0054]WLEN_H=120。
[0055]所述的WLEN_W为190,取图像金字塔对应列表的最后三个为(230,130),(138,78),(83,47)。
[0056]具体地,本专利技术还可以描述为以下实施方式:
[0057]1级联卷积网络需要对图像进行图像金字塔构建,项目以640*360为输入分辨率,以scale为0.6的缩放系数进行构造图像金字塔,金字塔图像列表计算公式为(input_w*0.6的n次方,input_h*0.6的n次方);
[0058]以人形检测最小检测大小为40为例,640*360对应的列表为(640,360),(384,216),(230,130),(138,78),(83,47),因为47再以0.6的比例缩放已经小于最小检测大小,所以(83,47)为最后一个金字塔图像;
[0059]2分块设计:
[0060]因为640*360的大分辨率图计算量占整体计算量的70%以上,所以重点对640*360进行分块优化;
[0061]16+3的设计理念:16指的是图像宽的方向分为四块,高的方向分为四块,3是指的金字塔列表里的最后三个。
[0062]16块的分块标准以以下公式计算:
[0063](INPUT_W-WLEN_W)/INC_W+1=FN_W (1)
[0064](INPUT_H-WLEN_H)/INC_H+1=FN_H (2)
[0065]INPUT_W/INPU本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种级联检测中分块优化的方法,其特征在于,所述方法包括以下步骤:S1,将图像分为16块,图像宽的方向分为四块,高的方向分为四块,确定图像金字塔列表里的最后三个;S2,所述16块的分块标准及块移按以下公式计算:(INPUT_W-WLEN_W)/INC_W+1=FN_W公式(1)(INPUT_H-WLEN_H)/INC_H+1=FN_H公式(2)INC_W=(INPUT_W

MIN_OBJECT_SIZE)/FN_W公式(3)其中,INPUT_W/INPUT_H为输入图像的宽/高;WLEN_W/WLEN_H为分块的宽/高长度;INC_W/INC_H为块移;FN_W/FN_H是在横向/纵向要分的块数;MIN_OBJECT_SIZE为最小检测物体大小,其保证跨越两块之间的最小物体不漏检。2.根据权利要求1所述的一种级联检测中分块优化的方法,其特征在于,所述方法选取M*N分辨率的输入图像,其分辨率大小使得图像计算量占整体计算量至少在60%以上。3.根据权利要求...

【专利技术属性】
技术研发人员:于晓静
申请(专利权)人:北京君正集成电路股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1