当前位置: 首页 > 专利查询>天津大学专利>正文

样本生成方法、装置、图像检测方法、模型训练方法制造方法及图纸

技术编号:46421350 阅读:7 留言:0更新日期:2025-09-19 20:30
本公开提供一种样本生成方法,应用于机器学习领域,包括:获取样本图像集,样本图像集包括多个第一样本图像和每个第一样本图像中第一对象的属性标签;确定与每个属性标签对应的第一文本描述特征;基于每个第一文本描述特征,分别从多个初始属性标签中确定目标属性标签,得到多个目标属性标签;基于第二样本图像的视觉特征与多个属性标签各自对应的第一文本描述特征之间的相似度、以及第二样本图像的视觉特征与多个目标属性标签各自对应的目标文本描述特征之间的相似度,确定表征第二样本图像的第二对象的属性是否存在于样本图像集中的多个属性标签中的检测结果;基于第二样本图像对应的检测结果和第二样本图像,生成训练样本。

【技术实现步骤摘要】

本专利技术涉及人机器学习领域,具体地,涉及样本生成方法、装置、图像检测方法、模型训练方法


技术介绍

1、分布外检测是机器学习领域中的一项关键技术,旨在识别测试数据中与模型训练数据分布显著不同的离群点样本。其核心目标是增强模型在真实场景中的鲁棒性和安全性,避免模型对未知数据做出高置信度的错误预测。相关技术中利用辅助的离群点样本、或基于分布内数据挖掘、构造出的离群点样本帮助模型训练。

2、在实现本公开构思过程中发现,相关技术中至少存在以下问题:训练过程中所使用的离群点样本数量稀少,且用于训练的离群点样本的特征与用于分布外检测所使用样本的特征存在差异,每个用于训练的离群点样本无法提供准确有效的语义信息监督,导致模型在分布外检测中的表现不佳。


技术实现思路

1、有鉴于此,本公开的提供了一种样本生成方法,包括:获取样本图像集,样本图像集包括多个第一样本图像和每个第一样本图像中第一对象的属性标签;确定与每个属性标签对应的第一文本描述特征;基于与每个属性标签对应的第一文本描述特征,分别从知识库的多个初始属性标本文档来自技高网...

【技术保护点】

1.一种样本生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述样本图像集中的属性标签同属于同一属性类别;

3.根据权利要求1所述的方法,其特征在于,所述基于与每个所述属性标签对应的所述第一文本描述特征,分别从知识库的多个初始属性标签中确定目标属性标签,得到多个目标属性标签,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于每个所述词嵌入特征对应的所述第一相似度值、所述第二相似度值和所述第三相似度值,从所述多个词嵌入特征中筛选第二目标词嵌入特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基...

【技术特征摘要】

1.一种样本生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述样本图像集中的属性标签同属于同一属性类别;

3.根据权利要求1所述的方法,其特征在于,所述基于与每个所述属性标签对应的所述第一文本描述特征,分别从知识库的多个初始属性标签中确定目标属性标签,得到多个目标属性标签,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于每个所述词嵌入特征对应的所述第一相似度值、所述第二相似度值和所述第三相似度值,从所述多个词嵌入特征中筛选第二目标词嵌入特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于第二样本图像...

【专利技术属性】
技术研发人员:韩瑞松韩宗博张长青
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1