当前位置: 首页 > 专利查询>浙江大学专利>正文

一种分布外样本感知的组合式图像识别方法技术

技术编号:42895838 阅读:61 留言:0更新日期:2024-09-30 15:13
本发明专利技术公开了一种分布外样本感知的组合式图像识别方法,该方法包括:获取图像样本并提取图像样本的视觉特征;利用候选标签集对属性表示和物体表示进行基元标签标注;将所有图像样本及对应的组合标签组成数据集;构建分类网络,其包括视觉特征提取模块,文本特征提取模块,分布外样本检测模块,预测模块以及结果输出模块;利用数据集对分类网络进行训练,以构建用于图像标签标注的图像识别模型;将待识别的图像和候选标签输入至图像识别模型,以输出图像对应的标签。本发明专利技术提供的方法能解决多标签环境下未知组合图像的识别任务难点,从而获得更加准确的识别结果。

【技术实现步骤摘要】

本专利技术属于计算机视觉,尤其涉及一种分布外样本感知的组合式图像识别方法


技术介绍

1、组合泛化指理解由已见基元组成的未见组合的能力,是人类智能的基本属性之一。为了评估视觉模型的这种能力,组合零样本学习要求通过学习已见组合来识别未见属性对象组合。具体而言,该任务的训练集包含带有组合概念的图像,例如白猫和黑狗。给定一张测试图像,目标是通过组合从训练数据中学到的已见基元,为图像分配一个新的组合概念,例如黑猫,为了综合评价模型的性能,组合式零样本学习通常遵循一个实用且具有挑战性的广义零样本学习设置,其测试集同时包含已见组合和未见组合。由于训练期间从未观察到未见组合的标签组合,已见组合和未见组合之间的分布差异显著,这导致模型在训练中学到的相关性可能在测试时会有害。

2、专利文献cn 117994596 a公开了基于孪生网络的肠造口图像识别与分类系统,所述系统包括:图像获取装置和孪生识别分类网络;所述图像获取装置,用于获取造口图像和对应的标签,将造口图像进行标准化,通过图像转换的方法生成训练集的镜像训练集;所述孪生识别分类网络,包括两个子网络,在训练阶本文档来自技高网...

【技术保护点】

1.一种分布外样本感知的组合式图像识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的分布外样本感知的组合式图像识别方法,其特征在于,通过视觉编码器对图像样本的视觉特征进行提取,其具体过程如下:

3.根据权利要求1所述的分布外样本感知的组合式图像识别方法,其特征在于,所述文本特征提取模块通过语言编码器进行构建,具体过程如下:

4.根据权利要求3所述的分布外样本感知的组合式图像识别方法,其特征在于,所述提示词模版的表达式如下:

5.根据权利要求1所述的分布外样本感知的组合式图像识别方法,其特征在于,所述分布外样本检测模块在组合未知组...

【技术特征摘要】

1.一种分布外样本感知的组合式图像识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的分布外样本感知的组合式图像识别方法,其特征在于,通过视觉编码器对图像样本的视觉特征进行提取,其具体过程如下:

3.根据权利要求1所述的分布外样本感知的组合式图像识别方法,其特征在于,所述文本特征提取模块通过语言编码器进行构建,具体过程如下:

4.根据权利要求3所述的分布外样本感知的组合式图像识别方法,其特征在于,所述提示词模版的表达式如下:

5.根据权利要求1所述的分布外样本感知的组合式图像识别方法,其特征在于,所述分布外样本检测模块在组合未知组合标签时,通过外点暴露方法将判别性约束添加至未知组合标签中,并对属性表示和物体表示添加解耦约束以保证...

【专利技术属性】
技术研发人员:陈昊张浩哲景宸琛沈春华
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1