【技术实现步骤摘要】
一种改善行人属性识别准确率的方法、终端及介质
本专利技术涉及计算机视觉
,具体地,涉及一种改善行人属性识别准确率的方法、终端及介质,可以辅助改善行人属性识别效果。
技术介绍
在基于深度学习的行人属性识别方法中,可以通过在网络中提供不同的约束条件改善行人属性识别性能。这些在网络中提供的各种先验约束的方法可以看作通过提升对行人内部不同特征间关系的学习,从而提升对目标特征的处理效果。实际监控中的输入图像中不仅包括行人信息,也包含有一些监控背景信息。同时,正常的掩膜提取网络在训练时需要提供较为复杂的像素级别的标注。
技术实现思路
本专利技术的目的在于克服现有技术的不足之处,提出了一种通过弱监督提取行人掩膜来改善行人属性识别准确率的方法。本专利技术第一方面,提供一种改善行人属性识别准确率的方法,包括:获取包含目标行人的图像I;采用行人区域掩膜提取网络F,提取所述图像I中目标行人区域掩膜T和背景区域掩膜B,其中,所述目标行人区域掩膜T和背景区域掩膜B互补,即T+B=1;对于前景区 ...
【技术保护点】
1.一种改善行人属性识别准确率的方法,其特征在于,包括:/n获取包含目标行人的图像I;/n采用行人区域掩膜提取网络F,提取所述图像I中目标行人区域掩膜T和背景区域掩膜B,其中,所述目标行人区域掩膜T和背景区域掩膜B互补,即T+B=1;/n对于前景区域掩膜B保留图像前景区域,通过第一生成器G1重建图像背景;对于背景区域掩膜T保留图像背景区域,通过第二生成器G2重建图像前景;所述第一生成器G1、所述第二生成器G2具有相同的网络结构;/n采用判别器D判断重建图像的真伪。/n
【技术特征摘要】
1.一种改善行人属性识别准确率的方法,其特征在于,包括:
获取包含目标行人的图像I;
采用行人区域掩膜提取网络F,提取所述图像I中目标行人区域掩膜T和背景区域掩膜B,其中,所述目标行人区域掩膜T和背景区域掩膜B互补,即T+B=1;
对于前景区域掩膜B保留图像前景区域,通过第一生成器G1重建图像背景;对于背景区域掩膜T保留图像背景区域,通过第二生成器G2重建图像前景;所述第一生成器G1、所述第二生成器G2具有相同的网络结构;
采用判别器D判断重建图像的真伪。
2.根据权利要求1所述的改善行人属性识别准确率的方法,其特征在于,所述采用行人区域掩膜提取网络F,提取所述图像I中目标行人区域掩膜T和背景区域掩膜B,包括:
将图像I输入行人区域掩膜提取网络F:
首先通过行人区域掩膜提取网络F中的卷积网络得到特征f∈Rw×h×c,其中w,h,c分别指代特征f的宽带,高度和通道数;
然后所述特征f通过不同大小的池化模块,池化为大小为w/2×h/2×c,w/3×h/3×c,w/6×h/6×c的特征,经过参数为3×3的卷积对特征进行进一步提取得到特征fc,然后对特征fc进行上采样操作后和原有特征f进行拼接操作,获得新的分割特征;
将所述分割特征通过卷积网络获得通道数为1的目标行人区域掩膜T,同时间接获得背景区域掩膜B=1-T。
3.根据权利要求1所述的改善行人属性识别准确率的方法,其特征在于,所述对于前景区域掩膜B保留图像前景区域,通过第一生成器G1重建图像背景,包括:
采用所述第一生成器G1对背景进行补全生成,基于自注意力的方式,对每个位置像素和其它位置进行关系建模,与原有区域叠加后得到重建图像Igen1;
所述对于背景区域掩膜T保留图像背景区域,通过第二生成器G2重建图像前景,包括:
采用所述第二生成器G2对行人区域进行补全生成,基于自注意力的方式,对每个位置像素和其它位置进行关系建模,与原有区域叠加后得到重建图像Igen2。
4.根据权利要求3所述的改善行人属性识别准确率的方法,其特征在于,所述第一生成器G1、所述第二生成器G2根据掩膜覆盖区域的部分图像信息,计算还原出合理的全局图像,其中:
所述第一生成器G1的输入信息为T⊙I,生成背景信息为V1,最终重建图像Igen1=T⊙I+B⊙V1;
所述第二生成器G2的输入信息为B⊙I,生成前景信息为V2,最终重建图像Igen2=B⊙I+T⊙V2。
5.根据权利要求1所述的改善行人属性识别准确率的方法,其特征在于,所述采用判别器D判断重建图像的真伪,其中:
在训练过程中为了对生成图像进行约束,判别...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。