一种在手机端实现感兴趣物体实时检测的方法技术

技术编号：20222187 阅读：94 留言：0更新日期：2019-01-28 20:34

本发明专利技术公开了在手机端实现感兴趣物体实时检测的方法，包括：利用深度学习训练框架构建压缩的物体检测模型并用ImageNet分类数据集预训练分类任务；再利用数据集Pascal VOC、COCO及预先构建的检测数据集训练检测任务；利用22层YOLO模型检测Pascal VOC和COCO中的物体；分别提取22层YOLO模型和物体检测模型的最后一层的对应激活值并计算两个激活值之间的均方误差；将均方误差与原有的物体检测损失进行平均，作为新的损失函数再次训练物体检测模型；导出训练好的物体检测模型的网络权重文件并在手机端加载，运行物体检测模型，对检测输出使用NMS算法，根据距屏幕中心的距离对检测置信度进行加权，提取出TOPN检测结果输出。

全部详细技术资料下载

【技术实现步骤摘要】
一种在手机端实现感兴趣物体实时检测的方法
本专利技术涉及物体检测
，尤其是涉及一种在手机本地实现用户可能感兴趣的物体的实时检测的方法。
技术介绍
物体检测技术是计算机视觉中非常重要的研究方向。目前基于卷积神经网络的物体检测技术取得了较好的研究效果，具有相当高的检测准确率。在服务器上运行的部分检测模型的检测速度可超过100帧每秒；在移动终端例如手机端实时检测感兴趣的物体，由于手机端计算资源有限，因此目前所支持的实时检测方案还较少。在手机本地进行实时的物体检测是很有价值的。在日常生活中，一些简单或者特定的物体检测，如最常见的人脸检测等，已经广泛地应用到了手机端。除此之外，从平常的一件商品，或者小到一只昆虫、大到一颗树，人们时常会对身边不认识的物体感兴趣。现在比较通用的做法是用户拍照后将照片通过网络上传给后台服务器来进行物体检测，然后再从服务器返回每个物体的检测结果、相关信息等。但这样的检测方案存在几个主要问题：首先是用户体验不好，即要求用户对物体拍照上传，从而每次检测识别都需要手动拍照选框等操作；整个照片的上传操作也容易让用户泄露更多的隐私；另外，如果所有的物体检测任务都由后台服务器完成的话，那么后台服务器压力会非常大。此时人们更希望可以直接用手机摄像头对着感兴趣的物体即可在手机本地实时获得物体的相关信息、链接等，但这样的物体检测模型的使用会受限于手机的运算能力、耗电量等因素，因此要在手机端实现还存在技术困难。人脸实时检测之所以已在手机端成熟地运行，一方面因为检测对象均为人脸而不是其它各种类型的物体，另一方面在维持可接受的检测精度的情况下，一些人脸检测等...

【技术保护点】
1.一种在手机端实现感兴趣物体实时检测的方法，包括以下步骤：S1、利用深度学习训练框架构建可在手机端运行的物体检测模型，其中，所述物体检测模型包含压缩的特征提取骨干网络；S2、利用ImageNet的分类数据集预训练所述物体检测模型的物体分类任务；S3、对经过预训练的所述物体检测模型，再利用公开数据集Pascal VOC、COCO以及预先构建的检测数据集训练其物体检测任务；S4、利用服务器22层YOLO模型检测公开数据集Pascal VOC和COCO中的物体；S5、基于步骤S3和步骤S4的物体检测结果，分别提取出22层YOLO模型和所述物体检测模型的最后一层的对应激活值，并计算两个激活值之间的均方误差；S6、取上一步得到的均方误差，与原有的物体检测损失进行平均，作为新的损失函数，用以再一次训练所述物体检测模型；S7、导出训练好的物体检测模型的网络权重文件；S8、在手机端加载所述网络权重文件，以运行所述物体检测模型，并对物体检测模型的输出使用改进后的非极大值抑制算法，根据距屏幕中心的距离对检测置信度进行加权，提取出TOP N检测结果，作为最终的物体检测结果输出；1≤N≤5。

【技术特征摘要】
1.一种在手机端实现感兴趣物体实时检测的方法，包括以下步骤：S1、利用深度学习训练框架构建可在手机端运行的物体检测模型，其中，所述物体检测模型包含压缩的特征提取骨干网络；S2、利用ImageNet的分类数据集预训练所述物体检测模型的物体分类任务；S3、对经过预训练的所述物体检测模型，再利用公开数据集PascalVOC、COCO以及预先构建的检测数据集训练其物体检测任务；S4、利用服务器22层YOLO模型检测公开数据集PascalVOC和COCO中的物体；S5、基于步骤S3和步骤S4的物体检测结果，分别提取出22层YOLO模型和所述物体检测模型的最后一层的对应激活值，并计算两个激活值之间的均方误差；S6、取上一步得到的均方误差，与原有的物体检测损失进行平均，作为新的损失函数，用以再一次训练所述物体检测模型；S7、导出训练好的物体检测模型的网络权重文件；S8、在手机端加载所述网络权重文件，以运行所述物体检测模型，并对物体检测模型的输出使用改进后的非极大值抑制算法，根据距...

【专利技术属性】
技术研发人员：袁春，邱鑫，
申请(专利权)人：清华大学深圳研究生院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人