一种基于深度神经网络检测的包络框的预测方法、系统及设备技术方案

技术编号:19858733 阅读:33 留言:0更新日期:2018-12-22 11:58
本发明专利技术公开了一种基于深度神经网络检测的包络框的预测方法、系统及设备。基于深度神经网络检测目标物体,获取所述目标物体的包络框的信息;设置感兴趣区域,计算所述目标物体的包络框与所述感兴趣区域的第一交并比;过滤小于第一阈值的所述第一交并比,并输出符合条件的所述目标物体的包络框的信息;根据三个以上视频帧的目标物体的包络框信息,通过加权线性回归法预测包络框的信息。此方法提高了系统预测的准确度和可信度,补足了神经网络在训练样本时因使用强约束条件加强判断时丢失的包络框的数据,增强了物体轨迹的完整性。

【技术实现步骤摘要】
一种基于深度神经网络检测的包络框的预测方法、系统及设备
本专利技术涉及物流
,尤其涉及基于深度神经网络检测的包络框的预测方法、系统及设备。
技术介绍
随着监控网络的发展,大量深度学习方法被用在视频及语音的提取上,其中典型的技术是通过深度神经网络对各类物体的检测。物流行业大量地使用监控技术来跟踪货物的走向,而基于深度学习方法来检测物体并跟踪物体轨迹是使用比较广泛的一种技术。物流行业对货物的类别和位置的准确度要求较高,但如果通过在深度学习过程中使用数据增广的样本技术,会产生大量误检,所以一般会使用强约束条件(一般通过神经网络检测物体时,即使物体不完整也会被检测到,这里的强约束条件是指通过设置神经网络,使其只能检测出相对完整的物体)来加强判断的正确性,虽然减少了误检,但却会出现丢失目标的情况。现有技术使用的解决方法是:检测到足够的物体包络框后再对缺失的包络框进行插值。这个方法的缺点是:1)在实时系统中,对消息的实时性要求极高,而进行回归时需要足够的预测值,这样会加大系统的延迟,即在检测到物体的包络框后,不能及时返回数据,因为需要缓存足够帧的物体包络框信息;2)插值缺失的帧时,如果要以这些帧来获取实时画面,那么这些帧也要被缓存,这需要占用计算机大量的内存空间,造成成本上升。
技术实现思路
为了解决上述技术问题,本专利技术的目的在于提供一种基于深度神经网络检测的包络框的预测方法、系统及设备。根据本专利技术的一个方面,提供了一种基于深度神经网络检测的包络框的预测方法,包括步骤:S1、基于深度神经网络检测视频帧中的目标物体,获取所述目标物体的包络框的信息;设置感兴趣区域,计算所述目标物体的包络框与所述感兴趣区域的第一交并比;S2、过滤小于第一阈值的所述第一交并比,并输出符合条件的所述目标物体的包络框的信息;S3、根据三个以上视频帧的目标物体的包络框信息,通过加权线性回归法预测包络框的信息。进一步的,所述包络框的信息包括所述包络框的帧号和/或坐标。进一步的,滤波装置接收所述包络框的信息,若所述滤波装置对所述信息有记忆,则输出所述信息;若否,则对所述信息进行加权线性回归法预测,并判断经过预测后的信息是否符合预设条件,若是,则输出所述预测后的信息。进一步的,所述预设条件包括,所述感兴趣区域与预测后的包络框的第二交并比大于/等于第一阈值或包络框的帧号等于/小于第二阈值。进一步的,所述加权线性回归法依据的公式包括:Wi=0.2+(2.0-0.2)/(N-1)*i,所述Wi为权值;所述N为滤波装置中记忆点总数,是自然数;所述i为小于N的自然数。进一步的,所述滤波装置包括若干个线性滤波器,输入所述线性滤波器的信息包括包络框的帧号和坐标。根据本专利技术的另一个方面,提供了一种基于深度神经网络检测的包络框的预测系统,包括:第一信息处理单元,配置用于基于深度神经网络检测视频帧中的目标物体,获取所述目标物体的包络框的信息;设置感兴趣区域,计算所述目标物体的包络框与所述感兴趣区域的第一交并比;第二信息处理单元,配置用于过滤小于第一阈值的所述第一交并比,并输出符合条件的所述目标物体的包络框的信息;包络框信息预测单元,配置用于根据三个以上视频帧的目标物体的包络框信息,通过加权线性回归法预测包络框的信息。进一步的,第一信息处理单元、第二信息处理单元及包络框信息预测单元,配置用于设置所述包络框的信息包括所述包络框的帧号和/或坐标。进一步的,包络框信息预测单元,还配置用于通过滤波装置接收所述包络框的信息,若所述滤波装置对所述信息有记忆,则输出所述信息;若否,则对所述信息进行加权线性回归法预测,并判断经过预测后的信息是否符合预设条件,若是,则输出所述预测后的信息。进一步的,包络框信息预测单元,还配置用于设置所述预设条件包括,所述感兴趣区域与预测后的包络框的第二交并比大于/等于第一阈值或包络框的帧号等于/小于第二阈值。进一步的,包络框信息预测单元,还配置用于预测所述包络框的信息依据的所述加权线性回归法的公式包括:Wi=0.2+(2.0-0.2)/(N-1)*i,所述Wi为权值;所述N为滤波装置中记忆点总数,是自然数;所述i为小于N的自然数。进一步的,包络框信息预测单元,还配置用于所述滤波装置包括若干个线性滤波器。进一步的,包络框信息预测单元,还配置用于所述滤波装置包括四个线性滤波器,输入所述线性滤波器的信息包括包络框的帧号和坐标。根据本专利技术的另一个方面,提供了一种设备,所述设备包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上任一项所述的方法。根据本专利技术的另一个方面,提供了一种存储有计算机程序的计算机可读存储介质,该程序被处理器执行时实现如上任一项所述的方法。与现有技术相比,本专利技术具有以下有益效果:1、本专利技术示例的基于深度神经网络检测的包络框的预测方法,基于深度神经网络检测视频帧中的目标物体,获取所述目标物体的包络框的信息;设置感兴趣区域,计算所述目标物体的包络框与所述感兴趣区域的第一交并比;过滤小于第一阈值的所述第一交并比,并输出符合条件的所述目标物体的包络框的信息;根据三个以上视频帧的目标物体的包络框信息,通过加权线性回归法预测包络框的信息。本实施例示例的基于深度神经网络检测的包络框的预测方法,通过过滤掉小于第一交并比的包络框的信息,根据三个以上视频帧的目标物体的包络框信息,通过加权线性回归法预测缺失的包络框的信息,可以补足因神经网络训练样本的强约束条件而丢失的包络框,极大的增强了物体轨迹的完整性;通过使用滤波装置进行预测同时判断预测的信息是否符合条件,提高了预测包络框信息的准确性;通过设置预设条件,即通过第二交并比与第一阈值的对比,确定物体的包络框是否有效,同时通过设置第二阈值,过滤掉非目标物体,提高预测的准确性;在线性滤波器中使用加权线性回归法对目标物体包络框的坐标进行预测,极大地提高了准确度和可信度;通过把线性滤波器输出的数据反转换成物体的包络框的数据,补足了丢失的关于物体包络框的数据,增强了物体轨迹的完整性。2、本专利技术示例的基于深度神经网络检测的包络框的预测系统,第一信息处理单元,配置用于基于深度神经网络检测视频帧中的目标物体,获取所述目标物体的包络框的信息;设置感兴趣区域,计算所述目标物体的包络框与所述感兴趣区域的第一交并比;第二信息处理单元,配置用于过滤小于第一阈值的所述第一交并比,并输出符合条件的所述目标物体的包络框的信息;包络框信息预测单元,配置用于根据三个以上视频帧的目标物体的包络框信息,通过加权线性回归法预测包络框的未来信息。本实施例示例的基于深度神经网络检测的包络框的预测系统,第二信息处理单元,配置用于通过过滤掉小于第一交并比的包络框的信息,以及包络框信息预测单元,配置用于根据三个以上视频帧的目标物体的包络框信息,通过加权线性回归法预测缺失的包络框的信息,可以补足因神经网络训练样本的强约束条件而丢失的包络框,极大的增强了物体轨迹的完整性;包络框信息预测单元,配置用于通过使用滤波装置进行预测同时判断预测的信息是否符合条件,提高了预测包络框信息的准确性;包络框信息预测单元,还配置用于通过设置预设条件,即通过第二交并比与第一阈值的对比,确定物体的本文档来自技高网...

【技术保护点】
1.一种基于深度神经网络检测的包络框的预测方法,其特征在于,包括步骤:S1、基于深度神经网络检测视频帧中的目标物体,获取所述目标物体的包络框的信息;设置感兴趣区域,计算所述目标物体的包络框与所述感兴趣区域的第一交并比;S2、过滤小于第一阈值的所述第一交并比,并输出符合条件的所述目标物体的包络框的信息;S3、根据三个以上视频帧的目标物体的包络框信息,通过加权线性回归法预测包络框的信息。

【技术特征摘要】
1.一种基于深度神经网络检测的包络框的预测方法,其特征在于,包括步骤:S1、基于深度神经网络检测视频帧中的目标物体,获取所述目标物体的包络框的信息;设置感兴趣区域,计算所述目标物体的包络框与所述感兴趣区域的第一交并比;S2、过滤小于第一阈值的所述第一交并比,并输出符合条件的所述目标物体的包络框的信息;S3、根据三个以上视频帧的目标物体的包络框信息,通过加权线性回归法预测包络框的信息。2.如权利要求1所述的基于深度神经网络检测的包络框的预测方法,其特征在于,所述包络框的信息包括所述包络框的帧号和/或坐标。3.如权利要求1所述的基于深度神经网络检测的包络框的预测方法,其特征在于,滤波装置接收所述包络框的信息,若所述滤波装置对所述信息有记忆,则输出所述信息;若否,则对所述信息进行加权线性回归法预测,并判断经过预测后的信息是否符合预设条件,若是,则输出所述预测后的信息。4.如权利要求3所述的基于深度神经网络检测的包络框的预测方法,其特征在于,所述预设条件包括,所述感兴趣区域与预测后的包络框的第二交并比大于/等于第一阈值或包络框的帧号等于/小于第二阈值。5.如权利要求1所述的基于深度神经网络检测的包络框的预测方法,其特征在于,所述加权线性回归法依据的公式包括:Wi=0.2+(2.0-0.2)/(N-1)*i,所述Wi为权值;所述N为滤波装置中记忆点总数,是自然数;所述i为小于N的自然数。6.如权利要求3所述的基于深度神经网络检测的包络框的预测方法,其特征在于,所述滤波装置包括若干个线性滤波器,输入所述线性滤波器的信息包括包络框的帧号和坐标。7.一种基于深度神经网络检测的包络框的预测系统,其特征在于,包括:第一信息处理单元,配置用于基于深度神经网络检测视频帧中的目标物体,获取所述目标物体的包络框的信息;设置感兴趣区域,计算所述目标物体的包络框与所述感兴趣区域的第一交并比;第二信息处理单元,配置用于过滤小于第一阈值的所述第一交并比,并输出符...

【专利技术属性】
技术研发人员:李海峰宋翔郭明坚
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1