The invention discloses a non-cooperative hand detection method, which includes four processes: the input image is extracted by depth neural network, then enhanced by context information attention module, then input area recommendation network to extract recommendation box, and finally classify and regress the recommendation box. Finally, an end-to-end depth neural network for hand detection is trained. The network has the function of hand detection. As long as the input image of the network is used, the detection results can be obtained.
【技术实现步骤摘要】
一种非配合手部检测方法
本专利技术涉及人机交互
中的手部检测,具体涉及一种增强检测性能的非配合手部检测方法。
技术介绍
手部检测是计算机视觉领域的一个重要问题,在生活中有着广泛的应用,例如手语识别、人机交互、虚拟现实以及安全驾驶监控等等。早期的手部检测的方法建立在约束场景或者约束位置的条件下,不适合推广到非配合非约束场景的情况中。随着深度学习技术的迅速发展,基于目标检测框架例如faster-rcnn或者yolo的方法逐步减少这个前提限制,效果越来越鲁棒。但目前的检测方法仍存在不少问题,手是一种非刚体结构,具有姿态多变的特点,而且手局部信息少,尺度多变,还存在目标小的问题,使得检测起来存在不少挑战。目前已有的方法例如基于区域的多尺度全卷积网络(MS-RFCN)融合不同尺度的特征层信息,减少对小目标的漏检,取得较好的效果,但是只关注全局信息忽略了对上下文信息利用。
技术实现思路
本专利技术的目的在于提出一种手部检测方法,弥补其他方法的不足。在提升检测精度的同时保持速度,促进手部检测的应用。本专利技术提供的技术方案如下:一种非配合手部检测方法,其特征在于包含以下步骤: ...
【技术保护点】
1.一种非配合手部检测方法,其特征在于包含以下步骤:S1.输入图像经过主干网络提取特征,从高层向底层传递语义信息,得到不同尺度的特征层的特征图谱;S2、接着在其中一层经过上下文信息注意模块进行特征增强;S3、再输入区域建议网络提取建议框;S4、最后进行建议框的分类与回归。
【技术特征摘要】
1.一种非配合手部检测方法,其特征在于包含以下步骤:S1.输入图像经过主干网络提取特征,从高层向底层传递语义信息,得到不同尺度的特征层的特征图谱;S2、接着在其中一层经过上下文信息注意模块进行特征增强;S3、再输入区域建议网络提取建议框;S4、最后进行建议框的分类与回归。2.如权利要求1所述的非配合手部检测方法,其特征在于:进行特征提取的主干网络为resnet101或者vggnet19,其采用特征金字塔网络或者如下框架之一进行手部检测:FasterR-CNN、R-FCN、SSD。3.如权利要求1所述的非配合手部检测方法,其特征在于:在特征输入区域建议网络之前或者主干网络中采用上下文信息模块进行上下文信息的选择性获取,以增强有效特征,减弱无关特征,提取上下文信息后达到特征增强的效果,输送到下一个卷积层或者区域建议网络中。4.如权利要求2所述的非配合手部检测方法,其特征在于:所述特征金字塔网络采用自底向上、自顶向下线路传递特征,自底向上是网络的前向过程,而自顶向下则把高层的语义信息传递到底层。5.如权利要求3所述的非配合手部检测方法,其特征在于:其中上下文信息的选择性获取方法采用空洞卷积扩大感受野,从而获...
【专利技术属性】
技术研发人员:郭振华,谢植淮,
申请(专利权)人:清华大学深圳研究生院,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。