【技术实现步骤摘要】
一种目标检测方法及装置
本申请实施例涉及机器学习
,尤其涉及一种目标检测方法及装置。
技术介绍
图像目标检测是指对图像中的目标进行位置检测并分类。在目标检测中,通常采用从待检测的图像或者待检测的图像的特征图中提取目标候选框的方法,目标候选框用于指示可能存在目标的矩形区域。但是对视频进行目标检测时,有时视频中某一帧图像中的物体之间会出现遮挡的情况,有时视频中高速移动的物体会出现运动模糊的情况,这时,基于单张图像的目标检测方法难以适应视频中的目标检测。
技术实现思路
由于现有技术中基于单张图像的目标检测方法难以适应视频中的目标检测的问题,本申请实施例提供了一种目标检测方法及装置,用以提高对视频进行目标检测的准确性。一方面,本申请实施例提供了一种目标对象检测方法,包括:采用神经网络模型中的第一目标卷积层从待检测视频图像中提取第一图像特征,所述待检测视频图像为待检测视频中的多帧视频图像的其中一帧视频图像;采用所述神经网络模型中的非局部模块,确定所述待检测视频图像的第一图像特征与参考视频图像的参考图像特征之间的关联信息,所述参考视频图像为所述多帧待检测图像中除所述待检测视频图像之外的其他一帧关联图像,所述参考图像特征为所述第一目标卷积层从所述参考视频图像中提取的;根据所述第一图像特征和所述关联信息,获得所述待检测视频图像中的目标对象。一方面,本申请实施例提供了一种神经网络模型,包括:第一目标卷积层、非局部模块、全连接层;所述第一目标卷积层,用于从待检测视频图像中提取第一图像特征,从参考视频图像中提取参考图像特征,所述待检测视频图像为待检测视频的多帧视频图像中的其中 ...
【技术保护点】
1.一种目标对象检测方法,其特征在于,包括:采用神经网络模型中的第一目标卷积层从待检测视频图像中提取第一图像特征,所述待检测视频图像为待检测视频的多帧视频图像中的其中一帧视频图像;采用所述神经网络模型中的非局部模块,确定所述待检测视频图像的第一图像特征与参考视频图像的参考图像特征之间的关联信息,所述参考视频图像为所述多帧待检测图像中除所述待检测视频图像之外的其他一帧关联图像,所述参考图像特征为所述第一目标卷积层从所述参考视频图像中提取的;根据所述第一图像特征和所述关联信息,获得所述待检测视频图像中的目标对象。
【技术特征摘要】
1.一种目标对象检测方法,其特征在于,包括:采用神经网络模型中的第一目标卷积层从待检测视频图像中提取第一图像特征,所述待检测视频图像为待检测视频的多帧视频图像中的其中一帧视频图像;采用所述神经网络模型中的非局部模块,确定所述待检测视频图像的第一图像特征与参考视频图像的参考图像特征之间的关联信息,所述参考视频图像为所述多帧待检测图像中除所述待检测视频图像之外的其他一帧关联图像,所述参考图像特征为所述第一目标卷积层从所述参考视频图像中提取的;根据所述第一图像特征和所述关联信息,获得所述待检测视频图像中的目标对象。2.如权利要求1所述的方法,其特征在于,所述采用所述神经网络模型中的非局部模块,确定所述待检测视频图像的第一图像特征与参考视频图像的参考图像特征之间的关联信息,包括:将所述第一图像特征进行第一线性映射,确定第一映射特征;将参考视频图像的参考图像特征进行第二线性映射,确定第二映射特征;根据所述第一映射特征与所述第二映射特征确定所述待检测视频图像与所述参考视频图像之间的关联度矩阵;将所述参考视频图像的参考图像特征进行第三线性映射,确定第三映射特征;根据所述第三映射特征以及所述关联度矩阵,获得所述待检测视频图像的第一图像特征与所述参考视频图像的参考图像特征之间的关联信息。3.如权利要求2所述的方法,其特征在于,所述根据所述第一映射特征与所述第二映射特征确定所述待检测视频图像与所述参考视频图像之间的关联度矩阵,包括:确定所述第一映射特征与所述第二映射特征的乘积;将所述乘积的指数确定为所述待检测视频图像与所述参考视频图像之间的关联度矩阵。4.如权利要求2所述的方法,其特征在于,所述根据所述第一映射特征与所述第二映射特征确定所述待检测视频图像与所述参考视频图像之间的关联度矩阵,包括:将所述第一映射特征与所述第二映射特征的乘积确定为所述待检测视频图像与所述参考视频图像之间的关联度矩阵。5.如权利要求2所述的方法,其特征在于,所述根据所述第一映射特征与所述第二映射特征确定所述待检测视频图像与所述参考视频图像之间的关联度矩阵,包括:确定所述第一映射特征中的第一图像特征与所述第二映射特征的参考图像特征的乘积;将所述乘积的指数确定为所述待检测视频图像与所述参考视频图像之间的关联度矩阵。6.如权利要求1至5任一项所述的方法,其特征在于,所述根据所述第一图像特征和所述关联信息,获得所述待检测视频图像中的目标对象,包括:对所述待检测视频图像的第一图像特征和所述关联信息求和,确定所述待检测视频图像的非局部特征;采用所述神经网络模型中的全连接层从所述非局部特征中获得所述待检测视频图像中的目标对象。7.如权利要求1至5任一项所述的方法,其特征在于,所述根据所述第一图像特征和所述关联信息,获得所述待检测视频图像中的目标对象,包括:对所述待检测视频图像的第一图像特征和所述关联信息求和,确定所述待检测视频图像的非局部特征;采用所述神经网络模型中的第二目标卷积层,从所述待检测视频图像的非局部特征中提取所述待检测视频图像的第二图像特征;采用所述神经网络模型中的全连接层,从所述第二图像特征中获得所述待检测视频图像中的目标对象。8.如权利要求1所述的方法,其特征在于,还包括:采用所述神经网络模型中的非局部模块,确定所述待检测视频图像的第一图像特征之间的关联信息。9.如权利要求8所述...
【专利技术属性】
技术研发人员:赵世杰,李峰,易阳,邱日明,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。