【技术实现步骤摘要】
一种基于联合训练策略的无监督行人重识别方法
本专利技术属于人工智能与行人重识别领域,特别涉及一种基于联合训练策略的无监督行人重识别方法。
技术介绍
行人重识别主要是对行人图像进行匹配,针对给定的行人图像找出与其同一类别的行人图像。行人重识别技术在智慧城市,智能安保等领域发挥着至关重要的作用,可应用的领域如犯罪嫌疑人的跟踪,失踪人口的搜寻,人流量的统计等等。近年来,有监督行人重识别任务已经取得了很大的进步,但是由于大规模监控系统的需求量大,监控数据不断增加,加上昂贵的标记成本,对大量人工标注的依赖大大限制了它的应用。因此,无监督行人重识别任务逐渐受到越来越多的关注,它可以直接从未标记数据中学习,具有更强的可扩展性,而且在工业领域中具有很大应用价值。目前无监督行人重识别任务研究的主要方法一般分为三类,(1)使用无监督域自适应方法来调整源域和目标域之间的特征分布。(2)利用摄像机感知方法使模型可以学习到区分不同摄像机下样本特征的能力。(3)通过聚类方法在目标域上生成用于训练的伪标签,并给相似图像分配相同的伪标签。第一类把无监督行人重识别任务定义为迁移学习任务,这类任务通常使用源域和目标域两个数据集,并采用源域上有标记的数据集来辅助训练。后两类是在完全无监督的情况下训练行人重识别模型。相对比无监督域自适应行人重识别方法,完全无监督行人重识别方法更具应用价值。这是因为当源域和目标域的特征分布差别较大时,很难获得高质量的伪标签,往往会因为标签噪声太多而影响性能。而且现实应用中,有标签的样本获取难度较大,这样也限制了无监督域自适应 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于联合训练策略的无监督行人重识别方法,其特征在于,步骤如下:步骤1:对行人图像进行划分,分成训练集和测试集;步骤2:使用加载预训练模型的CNN网络提取训练集的行人特征;选定的CNN为加载ImageNet预训练模型的ResNet50,并删除其最后一层分类层;把训练集所有图像输入到ResNet50中,假设提取第i幅图像的行人特征φ(x
i
),则形成的特征空间V(φ(x1),φ(x2),...,φ(x
n
));步骤3:使用Jaccard相似度公式计算行人特征之间的相似度,并利用密度聚类算法对特征之间相似度进行聚类并生成伪标签;使用相似度公式计算行人特征之间的相似度,计算公式如下:其中,s
i
和s
j
分别表示第i和第j个行人特征,J(s
i
,s
j
)表示行人特征s
i
和s
j
之间的相似度,∩表示交集,∪表示并集;得到行人特征之间的相似度之后利用密度聚类为每一个行人特征X={x1,x2,
…
,x
M
,x
M+1
,
…
,x
N
}分配伪标签Y={y1,y2,...,y
M
,y
M+1
,...,y
N
};步骤4:去掉离群特征,利用伪标签和对应的行人特征构建新的行人训练集;经过步骤3得到伪标签Y={y1,y2,
…
,y
M
,y
M+1
,
…
,y
N
}和对应训练集中行人特征X={x1,x2,...,x
M
,x
M+1
,...,x
N
},其中Y={y
M+1
,...,y
N
}是聚类产生的离散值伪标签,对应的离散值特征为X={x
M+1
,...,x
N
},最后去除掉离散值的训练集为X={x1,x2,...,x
M
},对应的伪标签为Y={y1,y2,...,y
M
};步骤5:提取步骤4构建的行人训练集来初始化行人质心和摄像机质心;计算具有相同伪标签的行人特征的算数平均值作为行人质心,计算具有相同摄像机ID的行人特征的算数平均值作为摄像机质心;经过步骤4得到去除掉离散值的训练集X={x1,x2,...,x
M
}和伪标签Y={y1,y2,...,y
M
},提取第i类伪标签的行人特征X
i
={x1,x2,...,x
n
},并计算该特征集合的平均值作为第i类行人质心,计算公式如下:其中,是一个d维向量,属于第i个聚类集合中的第n个行人实例特征;α
i
表示第i个聚类集合下的所有行人实例特征,|
·
|表示该聚类集合下的所有行人实例特征的数量,V
i
是第i类行人质心;提取第k个摄像机下的行人特征Y
k
={y1,y2,
技术研发人员:刘雨轩,葛宏伟,孙亮,候亚庆,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。