用于检测图像中人体位置的方法和装置制造方法及图纸

技术编号:25225025 阅读:23 留言:0更新日期:2020-08-11 23:14
本申请公开了用于检测图像中人体位置的方法和装置,涉及人工智能领域,具体实现方案为:从包括人体图像的待检测图像中,确定人体图像所对应的人体边框的位置坐标;基于学习得到的评估阈值向量,利用边框回归损失函数对待检测图像中人体图像所对应的人体边框的位置坐标进行多次回归计算,得到与评估阈值向量对应的回归偏移参数组集合;对回归偏移参数组集合中的各组回归偏移参数进行多维对比分析,确定最优的回归偏移参数组;基于最优的回归偏移参数组,生成最终的人体边框的位置坐标。该方案提升了人体边框位置坐标检测的精准度,进一步使人体图像的检测结果更加准确。

【技术实现步骤摘要】
用于检测图像中人体位置的方法和装置
本申请的实施例涉及计算机
,具体涉及人工智能领域,尤其涉及用于检测图像中人体位置的方法和装置。
技术介绍
随着互联网和人工智能技术的不断发展,越来越多的领域开始涉及自动化计算与分析,其中监控安防的人体检测功能是重要的场景之一。常见的安防视频领域的人体检测得到的人体框结果有时候会与实际目标有一定偏移,虽然与实际目标有重合部分,但可能无法完整的涵盖整个人体。当使用这种不够准确的人体检测框用于后续任务(比如分类,跟踪)时,往往会引入更多的误差,所以检测框如果能更好的覆盖目标人体,能对整体服务的效果有极大的提升。
技术实现思路
本申请提出了一种用于检测图像中人体位置的方法、装置、设备以及存储介质。根据第一方面,本申请提供了一种用于检测图像中人体位置的方法,该方法包括:从包括人体图像的待检测图像中,确定人体图像所对应的人体边框的位置坐标;基于学习得到的评估阈值向量,利用边框回归损失函数对待检测图像中人体图像所对应的人体边框的位置坐标进行多次回归计算,得到与评估阈值向量对应的回归偏移参数组集合;对回归偏移参数组集合中的各组回归偏移参数进行多维对比分析,确定最优的回归偏移参数组;基于最优的回归偏移参数组,生成最终的人体边框的位置坐标。在一些实施例中,基于学习得到的评估阈值向量,对待检测图像中人体图像所对应的人体边框的位置坐标,利用边框回归损失函数进行级联回归计算,得到与评估阈值向量对应的回归偏移参数组集合,包括:基于学习得到的评估阈值向量中的各个评估阈值,对待检测图像中人体图像所对应的人体边框的位置坐标,利用边框回归损失函数分别进行级联回归计算,得到与评估阈值向量对应的回归偏移参数组集合,其中,评估阈值向量为表征图像重叠度IOU的评估阈值的有序数值集合,有序数值集合中的数值从前至后逐渐递增。在一些实施例中,基于学习得到的评估阈值向量,利用边框回归损失函数对待检测图像中人体图像所对应的人体边框的位置坐标进行多次回归计算,得到与评估阈值向量对应的回归偏移参数组集合,包括:基于学习得到的评估阈值向量,对待检测图像中人体图像所对应的人体边框的位置坐标,利用边框回归损失函数进行级联回归计算,得到与评估阈值向量对应的回归偏移参数组集合;其中,评估阈值向量用于表征级联回归计算所需的初始评估阈值和级联步长,级联回归计算中的每次回归计算基于上一次回归计算得到的回归偏移参数组而进行。在一些实施例中,方法还包括:基于回归偏移参数组集合中的各组回归偏移参数,得到每组回归偏移参数对应的人体边框的位置坐标;将每组回归偏移参数对应的人体边框的位置坐标分别与预设人体框进行对比,确定最终的人体边框的位置坐标,其中,最终的人体边框的位置坐标为表征最接近预设人体框的位置坐标。在一些实施例中,从包括人体图像的待检测图像中,确定人体图像所对应的人体边框的位置坐标,包括:利用训练得到的深度网络模型对待检测图像进行检测,得到待检测图像中人体图像所对应的人体边框的位置坐标,其中,深度网络模型通过改变边框回归损失函数中评估阈值向量中的评估阈值训练得到。在一些实施例中,深度网络模型基于以下步骤训练得到:获取训练样本集,其中,训练样本集中的训练样本包括:各种类别的待检测图像;利用深度学习方法,将训练样本集中训练样本所包括的各种类别的待检测图像作为检测网络的输入,将输入的各种类别的待检测图像中人体图像的人体边框的位置坐标和学习得到的评估阈值向量输出,训练得到深度网络模型,其中,评估阈值向量的学习目标为使输出的人体边框的位置坐标逼近真实人体框的位置坐标。第二方面,本申请提供了一种用于检测图像中人体位置的装置,装置包括:人体位置确定单元,被配置成从包括人体图像的待检测图像中,确定人体图像所对应的人体边框的位置坐标;回归偏移计算单元,被配置成基于学习得到的评估阈值向量,利用边框回归损失函数对待检测图像中人体图像所对应的人体边框的位置坐标进行多次回归计算,得到与评估阈值向量对应的回归偏移参数组集合;偏移参数分析单元,被配置成对回归偏移参数组集合中的各组回归偏移参数进行多维对比分析,确定最优的回归偏移参数组;第一位置生成单元,被配置成基于最优的回归偏移参数组,生成最终的人体边框的位置坐标。在一些实施例中,回归偏移计算单元,包括:第一偏移计算模块,被配置成基于学习得到的评估阈值向量中的各个评估阈值,对待检测图像中人体图像所对应的人体边框的位置坐标,利用边框回归损失函数分别进行级联回归计算,得到与评估阈值向量对应的回归偏移参数组集合,其中,评估阈值向量为表征图像重叠度IOU的评估阈值的有序数值集合,有序数值集合中的数值从前至后逐渐递增。在一些实施例中,回归偏移计算单元,包括:第二偏移计算模块,被配置成基于学习得到的评估阈值向量,对待检测图像中人体图像所对应的人体边框的位置坐标,利用边框回归损失函数进行级联回归计算,得到与评估阈值向量对应的回归偏移参数组集合;其中,评估阈值向量用于表征级联回归计算所需的初始评估阈值和级联步长,级联回归计算中的每次回归计算基于上一次回归计算得到的回归偏移参数组而进行。在一些实施例中,装置还包括:人体位置计算单元,被配置成基于回归偏移参数组集合中的各组回归偏移参数,得到每组回归偏移参数对应的人体边框的位置坐标;第二位置生成单元,被配置成将每组回归偏移参数对应的人体边框的位置坐标分别与预设人体框进行对比,确定最终的人体边框的位置坐标,其中,最终的人体边框的位置坐标为表征最接近预设人体框的位置坐标。在一些实施例中,人体位置确定单元,包括:人体位置检测模块,被配置成利用训练得到的深度网络模型对待检测图像进行检测,得到待检测图像中人体图像所对应的人体边框的位置坐标,其中,深度网络模型通过改变边框回归损失函数中评估阈值向量中的评估阈值训练得到。在一些实施例中,人体位置检测模块的深度网络模型基于以下模块训练得到:样本获取模块,被配置成获取训练样本集,其中,训练样本集中的训练样本包括:各种类别的待检测图像;样本训练模块,被配置成利用深度学习方法,将训练样本集中训练样本所包括的各种类别的待检测图像作为检测网络的输入,将输入的各种类别的待检测图像中人体图像的人体边框的位置坐标和学习得到的评估阈值向量输出,训练得到深度网络模型,其中,评估阈值向量的学习目标为使输出的人体边框的位置坐标逼近真实人体框的位置坐标。第三方面,本申请提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。第四方面,本申请提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。根据本申请的技术采用从包括人体图像的待检测图像中,确定人体图像所对应的人体边框的位置坐标,基于学习得到的评估阈值向量,利用边框回归损失函数对待检测图像中人体图像所本文档来自技高网...

【技术保护点】
1.一种用于检测图像中人体位置的方法,所述方法包括:/n从包括人体图像的待检测图像中,确定所述人体图像所对应的人体边框的位置坐标;/n基于学习得到的评估阈值向量,利用边框回归损失函数对所述待检测图像中人体图像所对应的人体边框的位置坐标进行多次回归计算,得到与所述评估阈值向量对应的回归偏移参数组集合;/n对所述回归偏移参数组集合中的各组回归偏移参数进行多维对比分析,确定最优的回归偏移参数组;/n基于最优的回归偏移参数组,生成最终的人体边框的位置坐标。/n

【技术特征摘要】
1.一种用于检测图像中人体位置的方法,所述方法包括:
从包括人体图像的待检测图像中,确定所述人体图像所对应的人体边框的位置坐标;
基于学习得到的评估阈值向量,利用边框回归损失函数对所述待检测图像中人体图像所对应的人体边框的位置坐标进行多次回归计算,得到与所述评估阈值向量对应的回归偏移参数组集合;
对所述回归偏移参数组集合中的各组回归偏移参数进行多维对比分析,确定最优的回归偏移参数组;
基于最优的回归偏移参数组,生成最终的人体边框的位置坐标。


2.根据权利要求1所述的方法,其中,所述基于学习得到的评估阈值向量,对所述待检测图像中人体图像所对应的人体边框的位置坐标,利用所述边框回归损失函数进行级联回归计算,得到与所述评估阈值向量对应的回归偏移参数组集合,包括:
基于学习得到的评估阈值向量中的各个评估阈值,对所述待检测图像中人体图像所对应的人体边框的位置坐标,利用所述边框回归损失函数分别进行级联回归计算,得到与所述评估阈值向量对应的回归偏移参数组集合,其中,所述评估阈值向量为表征图像重叠度IOU的评估阈值的有序数值集合,所述有序数值集合中的数值从前至后逐渐递增。


3.根据权利要求1所述的方法,其中,所述基于学习得到的评估阈值向量,利用边框回归损失函数对所述待检测图像中人体图像所对应的人体边框的位置坐标进行多次回归计算,得到与所述评估阈值向量对应的回归偏移参数组集合,包括:
基于学习得到的评估阈值向量,对所述待检测图像中人体图像所对应的人体边框的位置坐标,利用所述边框回归损失函数进行级联回归计算,得到与所述评估阈值向量对应的回归偏移参数组集合;
其中,所述评估阈值向量用于表征级联回归计算所需的初始评估阈值和级联步长,所述级联回归计算中的每次回归计算基于上一次回归计算得到的回归偏移参数组而进行。


4.根据权利要求1所述的方法,所述方法还包括:
基于所述回归偏移参数组集合中的各组回归偏移参数,得到每组回归偏移参数对应的人体边框的位置坐标;
将每组回归偏移参数对应的人体边框的位置坐标分别与预设人体框进行对比,确定最终的人体边框的位置坐标,其中,所述最终的人体边框的位置坐标为表征最接近所述预设人体框的位置坐标。


5.根据权利要求1所述的方法,其中,所述从包括人体图像的待检测图像中,确定所述人体图像所对应的人体边框的位置坐标,包括:
利用训练得到的深度网络模型对所述待检测图像进行检测,得到所述待检测图像中人体图像所对应的人体边框的位置坐标,其中,所述深度网络模型通过改变边框回归损失函数中评估阈值向量中的评估阈值训练得到。


6.根据权利要求5所述的方法,其中,所述深度网络模型基于以下步骤训练得到:
获取训练样本集,其中,所述训练样本集中的训练样本包括:各种类别的待检测图像;
利用深度学习方法,将训练样本集中训练样本所包括的各种类别的待检测图像作为检测网络的输入,将所述输入的各种类别的待检测图像中人体图像的人体边框的位置坐标和学习得到的所述评估阈值向量输出,训练得到深度网络模型,其中,所述评估阈值向量的学习目标为使输出的人体边框的位置坐标逼近真实人体框的位置坐标。


7.一种用于检测图像中人体位置的装置,所述装置包括:
人体位置确定单元,被配置成从包括人体图像的待检测图像中,确定所述人体图像所对应的人体边框的位置坐标;
回归偏移计算单元,被配...

【专利技术属性】
技术研发人员:钟东宏袁宇辰孙昊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1