【技术实现步骤摘要】
基于自监督域感知网络的零样本训练及相关分类方法
本专利技术涉及人工智能与图像分类
,尤其涉及一种基于自监督域感知网络的零样本训练及相关分类方法。
技术介绍
随着深度学习技术的发展和海量训练数据的涌现,有监督目标识别已经取得突破性进展。然而,标注和收集图片数据十分耗费人力和时力,一些少见的类别,例如濒危动物,其图像资料是难以获得、极其珍贵的。在细粒度图像识别中,不同类别的细微差别依赖于专家知识来鉴别。现有的物体识别算法无法应对这一系列数据稀缺的场景。零样本学习是一类专门用于识别未见类别物体的算法,适用于少样本甚至零样本的目标识别。大多数零样本学习方法借助针对每一种类别描述的语义信息(如属性向量、词嵌入向量和文本描述等)实现从已见类别到未见类别间的知识迁移,通过构建视觉语义的跨模态联合嵌入空间将零样本识别转化为最近邻搜索问题。作为一类更加符合实际场景的方法,通用型零样本学习旨在同时识别源域中的已见类别和目标域中的未见类别。然而,传统的零样本识别受限于知识迁移能力的不足,无法充分挖掘目标域的数据分布,容易在源域数据上过拟合。这导致了偏向源域的强偏置问题,即训练时未见过的类别很有可能被识别为训练时已经见过的类别中的一种。
技术实现思路
本专利技术的目的是提供一种基于自监督域感知网络的零样本训练及相关分类方法,可以有效地减少通用型零样本识别中的域偏差问题,最终实现针对所有类别的更精确的综合判断。本专利技术的目的是通过以下技术方案实现的:一种基于自监督域感知网络的零样本训 ...
【技术保护点】
1.一种基于自监督域感知网络的零样本训练方法,其特征在于,包括:/n对于输入图像以及各类别的属性向量,通过视觉提取模块与语义嵌入模块对应地提取视觉增强特征与语义嵌入特征;通过深度网络计算视觉增强特征与语义嵌入特征的相似度,并与已知的输入图像和各类别对应关系,建立视觉语义对齐损失函数;所述输入图像包含了源域图像与目标域图像;/n利用编码了源域图像与目标域图像共享的视觉信息的多属性分类器的权重参数作为参考代理,并基于参考代理来重构源域图像与目标域图像的视觉增强特征;基于不同域图像的重构特征间的相似性,小于相同域图像的重构特征和其视觉增强特征之间的相似性的自监督信息,建立自监督学习的跨域三元组损失函数;/n基于视觉语义对齐损失函数与自监督学习的跨域三元组损失函数训练域感知网络,并反馈给视觉提取模块,使得视觉提取模块提取出域感知的视觉增强特征。/n
【技术特征摘要】
1.一种基于自监督域感知网络的零样本训练方法,其特征在于,包括:
对于输入图像以及各类别的属性向量,通过视觉提取模块与语义嵌入模块对应地提取视觉增强特征与语义嵌入特征;通过深度网络计算视觉增强特征与语义嵌入特征的相似度,并与已知的输入图像和各类别对应关系,建立视觉语义对齐损失函数;所述输入图像包含了源域图像与目标域图像;
利用编码了源域图像与目标域图像共享的视觉信息的多属性分类器的权重参数作为参考代理,并基于参考代理来重构源域图像与目标域图像的视觉增强特征;基于不同域图像的重构特征间的相似性,小于相同域图像的重构特征和其视觉增强特征之间的相似性的自监督信息,建立自监督学习的跨域三元组损失函数;
基于视觉语义对齐损失函数与自监督学习的跨域三元组损失函数训练域感知网络,并反馈给视觉提取模块,使得视觉提取模块提取出域感知的视觉增强特征。
2.根据权利要求1所述的一种基于自监督域感知网络的零样本训练方法,其特征在于,通过视觉提取模块提取输入图像的视觉增强特征时,先通过特征提取器提取出视觉特征xo,再通过特征增强层得到适应于语义对齐的视觉增强特征xa。
3.根据权利要求1所述的一种基于自监督域感知网络的零样本训练方法,其特征在于,通过语义嵌入模块提取各类别的属性向量包括:
对于每个类别给定的属性向量,通过若干层全连接网络和激活函数将其映射到对应的视觉空间中,得到语义嵌入特征ey;类别包含源域中的已见类别以及目标域中未见类别。
4.根据权利要求1所述的一种基于自监督域感知网络的零样本训练方法,其特征在于,所述通过深度网络计算视觉增强特征与语义嵌入特征的相似度,并与已知的输入图像和各类别对应关系,建立视觉语义对齐损失函数包括:
对于输入图像i,视觉提取模块提取的视觉增强特征记为对于类别j的属性向量,语义嵌入模块提取的语义嵌入特征记为
通过深度网络h计算视觉增强特征与语义嵌入特征的相似度:
其中,θSM是深度网络h的参数;
建立的视觉语义对齐损失函数表示为:
其中,n为类别总数;m为图像总数;yi、yj各自为输入图像i、类别j的类别标签,当yi=yj时,δ(yi,y...
【专利技术属性】
技术研发人员:张勇东,张天柱,伍佳敏,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。