【技术实现步骤摘要】
一种多类别目标检测的方法及系统
本申请涉及图像检测领域,具体而言,涉及一种多类别目标检测的方法。
技术介绍
室内人形与宠物检测,是指通过摄像头采集居民室内图片,并通过图像检测技术对图片中出现的人和宠物进行定位和分类。随着技术的进步和人们生活水平的提高,家用监护摄像头逐渐走进千家万户,通过手机app人们可以随时主动查看家内情况,对老人、婴幼儿或宠物等有着一定的看护作用。更进一步,目前已有商家提供图像检测功能,对监护摄像头采集的图像进行分析,并把检测到的人或宠物的图片通过app推送给用户,便于用户实时掌握信息。然而,现有技术中存在如下缺点:1.这种图像检测功能一般基于卷积神经网络(CNN)实现,计算量很大,都部署在云端专用图形处理单元(GPU)上,作为一种增值服务需要用户额外付费购买。2.从摄像头采集、传输、云端检测处理,到最后app消息推送,有较大的延迟,因此严格来讲这种方式并不是实时的,用户并不能获取最大效用。3.由于室内环境复杂,光照条件差,目前的图像检测算法鲁棒性不够,会出现一定程度的误检。 >
技术实现思路
...
【技术保护点】
1.一种多类别目标检测的方法,其特征在于,包括:/n搜索待检测图像中第一类目标及第二类目标,并获得定位框;/n分类定位框内的图像,并获得背景概率及目标概率;/n过滤分类不确定的所述定位框内的图像,并获得检测结果。/n
【技术特征摘要】
1.一种多类别目标检测的方法,其特征在于,包括:
搜索待检测图像中第一类目标及第二类目标,并获得定位框;
分类定位框内的图像,并获得背景概率及目标概率;
过滤分类不确定的所述定位框内的图像,并获得检测结果。
2.根据权利要求1所述的多类别目标检测的方法,其特征在于,搜索待检测图像中第一类目标及第二类目标,并获得定位框包括:
采用轻量级卷积神经网络,从输入图像中搜寻所有第一类目标和第二类目标,输出第一类目标和第二类目标的定位框以及该定位框属于第一类目标或第二类目标的概率;所述轻量级卷积神经网络的检测框架的特征融合从步长为32的层开始逐步向步长为4的层进行;
所述轻量级卷积神经网络包括七个输出层,每个输出层由定位和分类两个分支组成,定位分支得到定位框,分类分支得到该定位框属于第一类目标第二类目标的概率。
3.根据权利要求2所述的多类别目标检测的方法,其特征在于,分类定位框内的图像,并获得背景概率及目标概率包括:
基于所述轻量级卷积神经网络,将步长为8的层的特征图下采样4倍,然后与步长为32的层的特征图进行联结;网络输入为128x128大小的三通道RGB图像,输出为该图像属于第一类目标、第二类目标和背景的概率。
4.根据权利要求3所述的多类别目标检测的方法,其特征在于,过滤分类不确定的所述定位框内的图像,并获得检测结果包括:
根据第一类目标、第二类目标以及背景的概率依次为P1、P2、P3,判定为第一类目标或第二类目标的阈值为T,
若P1>T,且P1/P2>1000,则判定为第一类目标;
若P2>T,且P1/P2>1000,则判定为第二类目标;
其他情况,判定为背景。
5.根据权利要求4所述的多类别目标检测的方法,其特征在于,在原图中截取所有定位框,并将图像缩放到预定尺寸。
<...
【专利技术属性】
技术研发人员:王震,
申请(专利权)人:杭州涂鸦信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。