【技术实现步骤摘要】
图像目标检测方法、装置及存储介质
本专利技术涉及图像处理领域,特别是涉及一种图像目标检测方法、装置及存储介质。
技术介绍
随着科技的发展,图像中的目标识别技术已越来越成为计算机视觉的重要问题。即在给定的图片中,标注出要识别的物体,如在图片上标识出人、车、房子等物体。随着最近深度学习的兴起,使用深度学习在图像目标检测领域中的应用得到巨大的突破,一系列基于深度学习算法的图像目标学习方法被提出来。如Faster-RCNN(快速区域卷积神经网络,Faster-RegionswithConvolutionalNeuralNetworksfeatures)和YOLO(YouOnlyLookOnce)等深度学习算法。但是现有的图像目标检测算法的技术重心是放在检测结果的准确率上,因此现有的图像目标检测算法的运行速度并不满足实际场景的落地,一些相对比较高效的图像目标检测系统的模型大小均超过了100Mb,使得现有的图像目标检测系统运行速度较慢且无法在资源配置较小的移动终端上实施。
技术实现思路
本专利技术实施 ...
【技术保护点】
1.一种图像目标检测方法,其特征在于,包括:/n获取检测图像、n级深度特征图框架以及m级非深度特征图框架,n为大于等于2的整数,m为大于等于1的整数;其中特征图框架包括输出的特征尺寸以及维度;/n基于深度特征提取模型,使用i级深度特征图框架对所述检测图像的(i-1)级特征进行深度特征提取,以获取所述检测图像的i级特征,其中i为小于等于n的正整数;/n基于非深度特征提取模型,使用j级非深度特征图框架对所述检测图像的(j-1+n)级特征进非深度特征提取,以获取所述检测图像的(j+n)级特征,其中j为小于等于m的正整数;以及/n基于特征预测模型,对所述检测图像的a级特征至(m+n ...
【技术特征摘要】
1.一种图像目标检测方法,其特征在于,包括:
获取检测图像、n级深度特征图框架以及m级非深度特征图框架,n为大于等于2的整数,m为大于等于1的整数;其中特征图框架包括输出的特征尺寸以及维度;
基于深度特征提取模型,使用i级深度特征图框架对所述检测图像的(i-1)级特征进行深度特征提取,以获取所述检测图像的i级特征,其中i为小于等于n的正整数;
基于非深度特征提取模型,使用j级非深度特征图框架对所述检测图像的(j-1+n)级特征进非深度特征提取,以获取所述检测图像的(j+n)级特征,其中j为小于等于m的正整数;以及
基于特征预测模型,对所述检测图像的a级特征至(m+n)级特征进行信息回归操作,从而获取所述检测图像的目标类型以及目标位置,其中a为小于n且大于等于2的整数。
2.根据权利要求1所述的图像目标检测方法,其特征在于,所述深度特征提取模型包括深度输入卷积层、深度第一非线性转换卷积层、深度第二非线性转换卷积层以及深度输出卷积层;
所述基于深度特征提取模型,使用i级深度特征图框架对所述检测图像的(i-1)级特征进行深度特征提取,以获取所述检测图像的i级特征的步骤包括:
使用所述深度输入卷积层,对所述检测图像的(i-1)级特征进行升维操作,以得到所述检测图像的i级升维特征;
使用所述深度第一非线性转换卷积层,对所述检测图像的i级升维特征进行第一特征提取操作,以得到所述检测图像的i级第一卷积特征;
使用所述深度第二非线性转换卷积层,对所述检测图像的i级第一卷积特征进行第二特征提取操作,以得到所述检测图像的i级第二卷积特征;以及
使用所述深度输出卷积层,对所述检测图像的i级第二卷积特征进行降维操作,以得到所述检测图像的i级特征。
3.根据权利要求2所述的图像目标检测方法,其特征在于,所述深度输入卷积层的卷积核尺寸为1*1,所述深度第一非线性转换卷积层的卷积核尺寸为3*3,所述深度第二非线性转换卷积层的卷积核尺寸为3*3,所述深度输出卷积层的卷积核尺寸为1*1;
所述深度输入卷积层为具有非线性激活函数的标准卷积层,所述深度第一非线性转换卷积层为具有非线性激活函数的深度可分离卷积层,所述深度第二非线性转换卷积层为具有非线性激活函数的深度可分离卷积层,所述深度输出卷积层为不具有激活函数的标准卷积层。
4.根据权利要求3所述的图像目标检测方法,其特征在于,所述深度第二非线性转换卷积层为具有非线性激活函数的深度可分离空洞卷积层。
5.根据权利要求1所述的图像目标检测方法,其特征在于,所述非深度特征提取模型包括非深度输入卷积层、非深度非线性转换卷积层以及非深度输出卷积层;
所述基于非深度特征提取模型,使用j级非深度特征图框架对所述检测图像的(j-1+n)级特征进非深度特征提取,以获取所述检测图像的(j+n)级特征的步骤包括:
使用所述非深度输入卷积层,对所述检测图像的(j-1+n)级特征进行升维操作,以得到所述检测图像的(j+n)级升维特征;
使用所述非深度非线性转换卷积层,对所述检测图像的(j+n)级升维特征进行特征提取操作,以得到所述检测图像的(j+n)级卷积特征;以及
使用所述非深度输出卷积层,对所述检测图像的(j+n)级卷积特征进行降维操作,以得到所述检测图像的(j+n)级特征。
6.根据权利要求5所述的图像目标检测方法,其特征在于,所述非深度输入卷积层的卷积核尺寸为1*1,所述非深度非线性转换卷积层的卷积核尺寸为3*3,所述非深度输出卷积层的卷积核尺寸为1*1;
所述非深度输入卷积层为具有非线性激活函数的标准卷积层,所述非深度非线性转换卷积层为具有非线性激活函数的深度可分离卷积层,所述非深度输出卷积层为不具有激活函数的标准卷积层。
7.根据权利要求6所述的图像目标检测方法,其特征在于,所述非深度非线性转换卷积层为具有非线性激活函数的深度可分离空洞卷积层。
8.根据权利要求1所述的图像目标检测方法,其特征在于,所述特征预测模型包括特征分类卷积层以及特征输出卷积层;
所述基于特征预测模型,对所述检测图像的a级特征至(m+n)级特征进行信息回归操作,从而获取所述检测图像的目标类型以及位...
【专利技术属性】
技术研发人员:赵世杰,李峰,左小祥,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。