【技术实现步骤摘要】
图像聚类模型的训练方法及装置
[0001]本申请属于机器学习领域,尤其涉及一种图像聚类模型的训练方法及装置。
技术介绍
[0002]随着时代的发展和生产生活中对信息安全的需求日益提高,基于常见的生物特征如人脸、指静脉、掌静脉、虹膜等的识别技术逐渐成为研究热点,对这些常见的生物特征的识别则需要一种高效的聚类模型对其进行数据处理。
[0003]在处理图像聚类任务的问题上,传统的深度聚类算法是先通过无监督神经网络去学习从数据原始空间到低维空间的非线性映射,然后直接或间接的使用经典聚类算法将提取的特征划分为聚簇,这种做法在面临一些比较复杂的数据集时聚类效率差,鲁棒性低。
技术实现思路
[0004]本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种图像聚类模型的训练方法及装置,提升了模型的图像聚类效率和鲁棒性。
[0005]第一方面,本申请提供了一种图像聚类模型的训练方法,该方法包括:在所述图像聚类模型的预训练阶段,将原始图像对应的噪声图像和干净图像分别输入至所述第一编码器和所述第二编 ...
【技术保护点】
【技术特征摘要】
1.一种图像聚类模型的训练方法,其特征在于,图像聚类模型包括第一编码器、第二编码器和第一解码器,所述第一编码器与所述第一解码器相连,所述方法包括:在所述图像聚类模型的预训练阶段,将原始图像对应的噪声图像和干净图像分别输入至所述第一编码器和所述第二编码器,获得所述第一解码器输出的还原图像;基于所述噪声图像、所述干净图像和所述还原图像,构建去噪重构误差损失函数和对比损失函数,更新所述图像聚类模型的模型参数;在所述图像聚类模型的聚类训练阶段的聚类阶段,将图像数据集进行数据增强得到的第一样本图像和第二样本图像分别输入至所述预训练阶段训练结束后的所述图像聚类模型,获得所述图像聚类模型输出的第一图像特征和第二图像特征,并基于所述第一图像特征和所述第二图像特征,确定高置信样本集;在所述聚类训练阶段的微调阶段,将所述高置信样本集进行数据增强得到的第三样本图像和第四样本图像分别输入至所述图像聚类模型,获得所述图像聚类模型输出的第三图像特征和第四图像特征;基于所述第三图像特征和所述第四图像特征,构建实例
‑
原型级对比损失函数,更新所述图像聚类模型的模型参数,得到训练完成的所述图像聚类模型。2.根据权利要求1所述的图像聚类模型的训练方法,其特征在于,所述将原始图像对应的噪声图像和干净图像分别输入至所述第一编码器和所述第二编码器,获得所述第一解码器输出的还原图像,包括:将所述噪声图像输入至所述第一编码器,获得所述第一编码器输出的第一嵌入特征;将所述干净图像输入值所述第二编码器,获得所述第二编码器输出的第二嵌入特征;将所述第一嵌入特征输入至所述第一解码器,获得所述第一解码器输出的所述还原图像;所述基于所述噪声图像、所述干净图像和所述还原图像,构建去噪重构误差损失函数和对比损失函数,包括:基于所述干净图像和所述还原图像,确定所述去噪重构误差损失函数;基于所述第一嵌入特征和所述第二嵌入特征,确定所述对比损失函数。3.根据权利要求2所述的图像聚类模型的训练方法,其特征在于,应用公式确定所述去噪重构误差损失函数;其中,为第i个所述干净图像,为第i个所述噪声图像经过所述第一编码器和所述第一解码器输出的所述还原图像,L
rec
为所述去噪重构误差损失函数,N为所述预训练阶段中所述干净图像的总个数,为L2范数的平方;应用公式确定所述对比损失函数;
其中,a上标和b上标分别为不同组合顺序的数据增强,为第i个所述干净图像对应的对比损失函数,为第i个所述噪声图像对应的对比损失函数;为第i个所述噪声图像对应的对比损失函数;其中,τ
I
为温度参数,s(
·
)为余弦相似度,为经过所述第一编码器得到的所述第一嵌入特征,为经过所述第二编码器得到的所述第二嵌入特征。4.根据权利要求1所述的图像聚类模型的训练方法,其特征在于,所述第一编码器包括依次连接的卷积模块、三个带有残差结构的深度可分离卷积模块、两个不执行下采样操作的卷积模块以及残差卷积模块,所述第二编码器与所述第一编码器结构相同;所述第一解码器包括依次连接的线性层、五个转置卷积子模块和卷积层。5.根据权利要求1
‑
4任一项所述的图像聚类模型的训练方法,其特征在于,所述基于所述第一图像特征和所述第二图像特征,确定高置信样本集,包括:对所述第一图像特征进行聚类处理,确定所述图像数据集的第一聚类中心、...
【专利技术属性】
技术研发人员:王超,陈光,田丰,
申请(专利权)人:广州广电运通金融电子股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。