一种样本标注方法、装置、设备及存储介质制造方法及图纸

技术编号:44723721 阅读:19 留言:0更新日期:2025-03-21 17:50
本申请公开了一种样本标注方法、装置、设备及存储介质,涉及深度学习技术领域,包括:获取预先经过标注的原始烟叶图像,并基于标注结果从所述原始烟叶图像中提取相应的原始烟叶样本;基于预设分割技术对所述原始烟叶样本进行分割处理得到相应的目标烟叶样本,并利用预设深度学习模型确定所述目标烟叶样本的目标特征;利用预设统计方法对所述目标烟叶样本的所述目标特征进行降维处理,并基于预设聚类算法对降维后的所述目标特征进行聚类,以便基于聚类结果完成对所述目标烟叶样本的标注。这样一来,本申请可以在减少人工参与的前提下,减少用于深度学习模型训练所需的大量烟叶样本的标注工作,同时也解决了深度学习训练模型数据稀缺的问题。

【技术实现步骤摘要】

本专利技术涉及深度学习,特别涉及一种样本标注方法、装置、设备及存储介质


技术介绍

1、在烟草行业中,烟叶质量控制是至关重要的一环,而烟叶霉变则是影响其品质的关键因素之一。目前,通常采用人工标注或传统图像算法进行烟叶样本标注,而人工标注需要大量的人力资源,尤其是对于大规模数据集,成本会非常高、标注速度慢,难以满足快速迭代和大规模数据集的需求、且不同标注者可能对同一样本的标注结果存在差异,导致标注结果的一致性和准确性受到影响,长时间的标注工作容易导致标注人员的疲劳,从而增加标注错误的可能性。传统图像算法往往针对特定问题设计,对于新的或未见过的问题,其泛化能力有限,难以适应新的数据分布。且对于高维数据,传统算法需要更多的参数和更复杂的模型结构,因此难以有效处理。目前也可以通过大模型生成更具稳定性、平滑性和高质量的烟叶样本数据,但仍然是基于无监督学习的生成模型,仅从图像数据本身出发进行绘图,并不深入理解图像的语义或对象的生理结构。这可能导致生成的图像在视觉上非常类似于真实对象,但有时候生成分布与真实数据分布并不吻合。

2、综上所述,如何在减少人工参与本文档来自技高网...

【技术保护点】

1.一种样本标注方法,其特征在于,包括:

2.根据权利要求1所述的样本标注方法,其特征在于,所述基于标注结果从所述原始烟叶图像中提取相应的原始烟叶样本,包括:

3.根据权利要求1所述的样本标注方法,其特征在于,所述基于预设分割技术对所述原始烟叶样本进行分割处理得到相应的目标烟叶样本,包括:

4.根据权利要求1所述的样本标注方法,其特征在于,所述利用预设深度学习模型确定所述目标烟叶样本的目标特征,包括:

5.根据权利要求4所述的样本标注方法,其特征在于,所述基于所述目标烟叶样本的所述第一特征确定所述目标烟叶样本的所述目标特征,包括:

<...

【技术特征摘要】

1.一种样本标注方法,其特征在于,包括:

2.根据权利要求1所述的样本标注方法,其特征在于,所述基于标注结果从所述原始烟叶图像中提取相应的原始烟叶样本,包括:

3.根据权利要求1所述的样本标注方法,其特征在于,所述基于预设分割技术对所述原始烟叶样本进行分割处理得到相应的目标烟叶样本,包括:

4.根据权利要求1所述的样本标注方法,其特征在于,所述利用预设深度学习模型确定所述目标烟叶样本的目标特征,包括:

5.根据权利要求4所述的样本标注方法,其特征在于,所述基于所述目标烟叶样本的所述第一特征确定所述目标烟叶样本的所述目标特征,包括:

6.根据权利要求1所述的样...

【专利技术属性】
技术研发人员:彭德腾江炎军王先兵乐灿邹明明莫国韬
申请(专利权)人:湖南中烟工业有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1