一种图像识别方法及装置制造方法及图纸

技术编号:25044427 阅读:34 留言:0更新日期:2020-07-29 05:34
本发明专利技术提供了一种图像识别方法,包括:S1,获取训练图像集,将训练图像集中的各训练图像与该训练图像对应的类别索引进行训练,学习提取无语义视觉表达;S2,将训练图像集中各训练图像与该训练图像所对应的语义标签对齐,学习提取语义对齐的视觉表达;S3,同时对无语义视觉表达及语义对齐的视觉表达进行识别分析,得到视觉偏见消除模型;S4,将待识别图像输入视觉偏见消除模型,进行识别。本发明专利技术提供的图像识别方法通过建立视觉偏见消除模型,可以提升对已知域和未知域样本的感知效果,进而实现无偏差零样本的准确识别。

【技术实现步骤摘要】
一种图像识别方法及装置
本专利技术涉及一种基于域感知的偏见消除技术实现无偏差零样本图像的识别的应用,具体涉及一种图像识别方法及装置。
技术介绍
零样本学习旨在同时识别已知类别(已知域)或未知类别(未知域)的图像样本。最近的方法侧重于学习一种语义对齐的视觉表达来将已知域的知识迁移到未知域。然而由于语义知识的弱区分性,这种语义对齐的视觉表达很难将两个域分开,因此,会导致未知域的图像更倾向于被识别成已知域类别。
技术实现思路
(一)要解决的技术问题本专利技术提供的一种图像识别方法及装置,用于至少解决上述问技术题。(二)技术方案本专利技术一方面提供一种图像识别方法,包括:S1,获取训练图像集,将所述训练图像集中的各训练图像与该训练图像对应的类别索引进行训练,学习提取无语义视觉表达;S2,将所述训练图像集中各训练图像与该训练图像所对应的语义标签对齐,学习提取语义对齐的视觉表达;S3,同时对所述无语义视觉表达及所述语义对齐的视觉表达进行识别分析,得到视觉偏见消除模型;S4,将待识别图像输入所述视觉偏见消除模型,进本文档来自技高网...

【技术保护点】
1.一种图像识别方法,包括:/nS1,获取训练图像集,将所述训练图像集中的各训练图像与该训练图像对应的类别索引进行训练,学习提取无语义视觉表达;/nS2,将所述训练图像集中各训练图像与该训练图像所对应的语义标签对齐,学习提取语义对齐的视觉表达;/nS3,同时对所述无语义视觉表达及所述语义对齐的视觉表达进行识别分析,得到视觉偏见消除模型;/nS4,将待识别图像输入所述视觉偏见消除模型,进行识别。/n

【技术特征摘要】
1.一种图像识别方法,包括:
S1,获取训练图像集,将所述训练图像集中的各训练图像与该训练图像对应的类别索引进行训练,学习提取无语义视觉表达;
S2,将所述训练图像集中各训练图像与该训练图像所对应的语义标签对齐,学习提取语义对齐的视觉表达;
S3,同时对所述无语义视觉表达及所述语义对齐的视觉表达进行识别分析,得到视觉偏见消除模型;
S4,将待识别图像输入所述视觉偏见消除模型,进行识别。


2.根据权利要求1所述的方法,其中,步骤S1中,所述学习提取无语义视觉表达,包括:
提取所述训练图像集中的各训练图像的视觉信息的二阶统计量,增强所述训练图像集中各训练图像之间的类间可区分性。


3.根据权利要求2所述的方法,其中,步骤S1中,所述增强所述训练图像集中各图像之间的类间可区分性,包括:
设置一损失函数,所述损失函数包含一预设范围大小的边缘系数,所述边缘系数的大小取决于所述训练图像的类间决策边界距离;
使所述边缘系数可自适应学习,以增强所述训练图像集中各图像之间的类间可区分性。


4.根据权利要求1所述的方法,其中,步骤S2中,将所述训练图像集中各训练图像与该训练图像所对应的语义标签对齐,包括:
通过自动搜索网络框架生成所述训练图像的语义对齐视觉表达,使所述语义对齐视觉表达与该训练图像语义标签对齐。


5.根据权利要求4所述的方法,其中,所述通过自动搜索网络框架生成所述训练图像的语义对齐视觉表达,包括:
通过有向无环图训练所述训练图像,所述有向无环图中包括至少两个节点;
自动搜索所述至少两个节点之间的操作,得到所述训练图像的语义对齐视觉表达。


6.根据权利要求5所述的方...

【专利技术属性】
技术研发人员:张勇东闵少波谢洪涛
申请(专利权)人:中国科学技术大学北京中科研究院
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1