【技术实现步骤摘要】
目标处理方法、目标处理模型的训练方法及其装置
[0001]本申请涉及人工智能
,具体涉及计算机视觉、深度学习
,可应用于智能交通场景下,尤其涉及目标处理方法、目标处理模型的训练方法及其装置。
技术介绍
[0002]目前,对目标进行处理(比如,目标跟踪)是计算机视觉领域中重要的研究方向和应用方法。目标处理是在给定视频中同时可对多个感兴趣的目标进行定位,维持对应ID、以及记录对应轨迹等。目前,目标处理技术已经广泛运用于生活以及军事等多个方面。
[0003]相关技术中,通过简单预测前后图像帧间实例之间的像素偏移,即可完成目标处理,但是,上述目标处理方法无法达到目标实时处理,并且处理方式单一,目标处理效果较差。
技术实现思路
[0004]本申请提供了一种用于目标处理方法、目标处理模型的训练方法及其装置。
[0005]根据本申请的一方面,提供了一种目标处理方法,包括:获取当前图像帧以及参考实例分割图;根据所述当前图像帧和所述参考实例分割图,生成所述当前图像帧对应的特征图;根据所述特征图,生成所述当前图像帧对应的实例中心图、以及至少一种处理方式的偏移图;根据所述实例中心图以及所述至少一种处理方式的偏移图,生成所述当前图像帧在所述至少一种处理方式下的目标处理结果。
[0006]根据本申请的另一方面,提供了一种目标处理模型的训练方法,包括:获取初始的目标处理模型,其中,所述目标处理模型包括:用于对当前图像帧以及参考实例分割图进行编码生成特征图的编码模块、用于对特征图进行解码生成实例 ...
【技术保护点】
【技术特征摘要】
1.一种目标处理方法,包括:获取当前图像帧以及参考实例分割图;根据所述当前图像帧和所述参考实例分割图,生成所述当前图像帧对应的特征图;根据所述特征图,生成所述当前图像帧对应的实例中心图、以及至少一种处理方式的偏移图;根据所述实例中心图以及所述至少一种处理方式的偏移图,生成所述当前图像帧在所述至少一种处理方式下的目标处理结果。2.根据权利要求1所述的方法,其中,所述获取当前图像帧以及参考实例分割图,包括:获取图像序列中的所述当前图像帧;获取所述图像序列中位于所述当前图像帧之前的历史图像帧;将所述历史图像帧的实例分割图,确定为所述参考实例分割图。3.根据权利要求1所述的方法,其中,所述根据所述当前图像帧和所述参考实例分割图,生成所述当前图像帧对应的特征图,包括:根据所述参考实例分割图,确定所述参考实例分割图对应的参考图像帧中各个像素属于相应实例的概率,并生成参考语义热力图;获取所述参考图像帧的全局上下文向量;根据所述全局上下文向量、所述当前图像帧和所述参考语义热力图,生成所述特征图。4.根据权利要求1所述的方法,其中,根据所述特征图,生成所述当前图像帧对应的实例中心图,包括:根据所述特征图,生成所述当前图像帧对应的语义种子图,其中,所述语义种子图包括:所述当前图像帧中各个实例的边界信息以及中心信息;提取所述语义种子图中的中心信息,生成所述实例中心图。5.根据权利要求1所述的方法,其中,所述处理方式包括:实例分割方式,所述实例分割方式的偏移图包括:所述当前图像帧中各个像素相对于相应实例中心的偏移信息;所述根据所述实例中心图以及所述至少一种处理方式的偏移图,生成所述当前图像帧在所述至少一种处理方式下的目标处理结果,包括:根据所述实例中心图中各个实例中心的位置信息,以及所述当前图像帧中各个像素相对于相应实例中心的偏移信息,确定所述当前图像帧中各个实例的位置信息;根据所述当前图像帧中各个实例的位置信息,确定所述当前图像帧在实例分割方式下的实例分割结果。6.根据权利要求1或5所述的方法,其中,所述处理方式包括:边框检测方式,所述边框检测方式的偏移图包括:所述当前图像帧中各个实例的边框顶点相对于相应实例中心的偏移信息;所述根据所述实例中心图以及所述至少一种处理方式的偏移图,生成所述当前图像帧在所述至少一种处理方式下的目标处理结果,包括:根据所述实例中心图中各个实例中心的位置信息,以及所述当前图像帧中各个实例的边框顶点相对于相应实例中心的偏移信息,确定所述当前图像帧中各个实例的边框信息;根据所述当前图像帧中各个实例的边框信息,确定所述当前图像帧在边框检测方式下的边框检测结果。
7.根据权利要求6所述的方法,其中,所述处理方式包括:目标跟踪方式,所述目标跟踪方式的偏移图包括:所述当前图像帧中各个实例的中心相对于所述参考实例分割图中相应实例的中心的偏移信息;所述根据所述实例中心图以及所述至少一种处理方式的偏移图,生成所述当前图像帧在所述至少一种处理方式下的目标处理结果,包括:根据所述实例中心图中各个实例中心的位置信息,以及所述当前图像帧中各个实例的中心相对于所述参考实例分割图中相应实例的中心的偏移信息,确定所述当前图像帧中各个实例的位置信息;根据所述当前图像帧中各个实例的位置信息,确定所述当前图像帧在所述目标跟踪方式下的目标跟踪结果。8.一种目标处理模型的训练方法,包括:获取初始的目标处理模型,其中,所述目标处理模型包括:用于对当前图像帧以及参考实例分割图进行编码生成特征图的编码模块、用于对特征图进行解码生成实例中心图的语义解码模块、用于对特征图进行解码生成偏移图并结合所述实例中心图生成目标处理结果的偏移解码模块;获取训练数据,其中,所述训练数据包括:样本图像帧、样本参考实例分割图以及样本目标处理结果;以所述样本图像帧和所述样本参考实例分割图为输入数据,结合所述目标处理模型输出的预测目标处理结果以及所述样本目标处理结果构建损失函数,对所述初始的目标处理模型进行训练。9.根据权利要求8所述的方法,其中,所述损失函数由以下子损失函数中的至少一种组成:实例损失函数、边框损失函数、跟踪损失函数、语义损失函数以及偏移损失函数。10.一种目标处理装置,包括:获取模块,用于获取当前图像帧以及参考实例分割图;第一生成模块,用于根据所述当前图像帧和所述参考实例分割图,生成所述当前图像帧对应的特征图;第二生成模块,用于根据所述特征图,生成所述当前图像帧对应的实例中心图、以及至少一种处理方式的偏移图;第三生成模块,用于根据所述实例中心图以及所述至少一种处理方式...
【专利技术属性】
技术研发人员:张伟,谭啸,孙昊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。