【技术实现步骤摘要】
图像的关联方法及装置、存储介质和电子装置
本专利技术涉及计算机领域,具体而言,涉及一种图像的关联方法及装置、存储介质和电子装置。
技术介绍
在计算机视觉领域中,目标关联就是将视觉算法感知到的不同目标进行关联分析。计算机视觉领域现有的目标关联方法常用的是基于参考人体姿态估计方法,比如卡内基梅隆的Open-pose,它的做法是首先在深度网络热力特征图上对人体各个关键点进行预测,然后根据网络训练的嵌入向量对关键点进行聚集,最后进一步估计出人体姿态。其他的一些方法,比如GoogleAI采用框的注意力机制来目标之间的关联,网络输入需要目标注意力模板的不断反馈。还有基于图理论来建立目标之间的关系,比如香港大学提出的方法,其首先需要CNN来提取特征并检测输出各个目标,之后将各个目标的特征信息送入图网络进行关联,最后输出关联的结果。但基于关键点检测和聚合的方法,比如Open-pose,在经过骨干网络后,又要进入6个阶段的子网络,每个子网络由2个分支构成,这样庞大的网络需要消耗很大的计算资源。在很多场景这样的计算资源消耗,往往会需要高性能的设备来满足实时性,而且该方法只能估计出人体和人脸的坐标点位置,不能生成目标的回归框。Open-pose的方法首先需要检测出人体关键点,之后在进行提纯的时候需要引入中间层的损失,这样做虽然保证了网络不会出现梯度消失或爆炸,但是却大大增加了网络训练的难度,降低了速度,较难达到实时性要求,同时在现实中人体关键点标签的获取往往比框标签的获取更困难。基于注意力机制的方法,在目标建立关系的时候需 ...
【技术保护点】
1.一种图像的关联方法,其特征在于,包括:/n将待处理的图像输入到目标神经网络中,并从所述目标神经网络的输出层得到输出结果,其中,所述待处理的图像中包括多个目标图像,每一个目标图像中包括第一对象和第二对象,所述第一对象和所述第二对象具有关联关系;所述输出层中的通道数量由下述参数确定:将所述待处理图像划分为多个网格后所述网格的数量、组成各个网格的框的数量、所述框在所述待处理的图像中的位置信息、置信度、所述第一对象与所述第二对象的类别概率、根据所述第一对象预测的所述第二对象的位置信息;所述输出结果中包括多个与所述第一对象相关的检测框,以及与所述第二对象相关的检测框;/n根据非极大抑制NMS对所述输出结果中的多个检测框进行过滤;/n从过滤后的多个检测框中,根据各个检测框的重叠度IoU确定出具有所述关联关系的检测框。/n
【技术特征摘要】 【专利技术属性】
1.一种图像的关联方法,其特征在于,包括:
将待处理的图像输入到目标神经网络中,并从所述目标神经网络的输出层得到输出结果,其中,所述待处理的图像中包括多个目标图像,每一个目标图像中包括第一对象和第二对象,所述第一对象和所述第二对象具有关联关系;所述输出层中的通道数量由下述参数确定:将所述待处理图像划分为多个网格后所述网格的数量、组成各个网格的框的数量、所述框在所述待处理的图像中的位置信息、置信度、所述第一对象与所述第二对象的类别概率、根据所述第一对象预测的所述第二对象的位置信息;所述输出结果中包括多个与所述第一对象相关的检测框,以及与所述第二对象相关的检测框;
根据非极大抑制NMS对所述输出结果中的多个检测框进行过滤;
从过滤后的多个检测框中,根据各个检测框的重叠度IoU确定出具有所述关联关系的检测框。
2.根据权利要求1所述的方法,其特征在于,将待处理的图像输入到目标神经网络中,并从所述目标神经网络的输出层得到输出结果,包括:
将所述待处理图像输入所述目标神经网络中输出层;
根据所述输出层的通道对所述待处理图像进行处理,得到多个与所述第一对象相关的检测框与多个与所述第二对象相关的检测框;其中,与所述第二对象相关的检测框包括:检测到的与第二对象相关的检测框,根据多个与所述第一对象相关的检测框预测的与第二图像相关的检测框。
3.根据权利要求2所述的方法,其特征在于,从过滤后的多个检测框中根据各个检测框的重叠度IoU确定出具有所述关联关系的检测框,包括:
确定每一个检测到的与第二对象相关的检测框和根据多个与第一对象相关的检测框预测的与第二图像相关的检测框之间的IoU;
从中选择IoU最大的检测到的与第二对象相关的检测框和根据多个与第一对象相关的检测框预测的与第二图像相关的检测框具有所述关联关系。
4.根据权利要求1所述的方法,其特征在于,所述根据非极大抑制NMS对所述输出结果中的多个检测框进行过滤,包括:
S1,根据每一个检测框的置信度从所述输出结果中的多个检测框选择出置信度最高的第一检测框;
S2,确定所述第一检测框与所述输出结果中的其他检测框之间的多个IoU;
S3,从多个IoU中确定出大于预设阈值的IoU,并从确定出的IoU中过滤掉所述第一检测框外的另一个检测框;
S4,从剩余的检测框中根据置信度排序重复执行上述步骤S1至步骤S3,直到置信度最低检测框。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述目标神经网络中的损失函数为总方差损失函数与交叉熵损失函数的组合。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述输出层的数量为3,且该3个输出层的尺度相互之间均不一致。
技术研发人员:于晋川,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。