System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 训练图像的标签确定方法、装置、设备及存储介质制造方法及图纸_技高网

训练图像的标签确定方法、装置、设备及存储介质制造方法及图纸

技术编号:44202283 阅读:19 留言:0更新日期:2025-02-06 18:37
本发明专利技术提供一种训练图像的标签确定方法、装置、设备及存储介质,应用于计算机技术领域,该方法包括:获取多个训练图像及预设聚类算法的多个目标聚类参数;根据原始类别标签的总类别数及各目标聚类参数对多个训练图像进行聚类,确定多个训练图像的多个第一特征矩阵;多个第一特征矩阵的数量与总类别数相同;将各训练图像输入至第一神经网络模型中进行分类处理,确定每个训练图像对应的第二特征矩阵;针对每个训练图像,在多个第一特征矩阵中获取训练图像的原始类别标签对应的目标第一特征矩阵,并根据第二特征矩阵和目标第一特征矩阵之间的相似度,确定训练图像对应的目标类别标签。采用本发明专利技术技术方案可以提升最终训练的神经网络的精度。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种训练图像的标签确定方法、装置、设备及存储介质


技术介绍

1、随着人工智能技术的高速发展,目前对于人工智能相关算法指标的期望也越来越高,这就需要能够训练出更高精度和准确性的人工智能相关网络模型。

2、相关技术中,在网络模型的训练过程中,比如可以预先收集不同的训练样本(比如不同的训练图像),然后可以对这些训练样本分别进行打标签,然后通过打标签后的训练样本对网络模型进行训练。然而,在打标签的过程中可能会由于数据标签标定难度大或其它原因引起的易标定错误的情况,例如图像模糊导致不易判断类别、标定人员自身引起的标定错误等,这些都可能会导致最终获得的标签不够准确,目前也有一些提升标定的标签准确性的方法,比如标签平滑技术、数据清洗技术等。

3、然而,上述技术确定的训练样本的标签在训练网络模型时仍然效果不佳。


技术实现思路

1、本专利技术提供一种训练图像的标签确定方法、装置、设备及存储介质,用以解决现有技术中通过标签平滑技术或数据清洗技术等确定的训练样本的标签效果仍然不佳的缺陷,实现通过训练图像及其原始类别标签先确定预设聚类算法的多个目标聚类参数,并根据目标聚类参数对多个训练图像进行聚类之后获得的特征矩阵与神经网络输出的特征矩阵之间的相似度,确定各训练图像的目标类别标签,这样通过聚类的特征矩阵辅助确定训练图像的目标标签可以降低神经网络对标签的依赖性,提高最终训练的神经网络的精度以及减少人工对标签标定的工作量。

2、本专利技术提供一种训练图像的标签确定方法,包括:

3、获取预先标注的多个训练图像以及获取预设聚类算法对应的多个目标聚类参数;每个训练图像均包括自身对应的原始类别标签,上述多个目标聚类参数预先根据多个训练图像及每个训练图像的原始类别标签确定;

4、根据原始类别标签对应的总类别数以及各目标聚类参数对多个训练图像进行聚类,确定多个训练图像对应的多个第一特征矩阵;上述多个第一特征矩阵的数量与总类别数相同,且每个第一特征矩阵对应一种类别标签下的训练图像的特征;

5、将各训练图像输入至第一神经网络模型中进行分类处理,确定每个训练图像对应的第二特征矩阵;

6、针对每个训练图像,在多个第一特征矩阵中获取训练图像的原始类别标签对应的目标第一特征矩阵,并根据第二特征矩阵和目标第一特征矩阵之间的相似度,确定训练图像对应的目标类别标签;目标类别标签用于对第一神经网络模型进行训练。

7、根据本专利技术提供的一种训练图像的标签确定方法,上述训练图像的目标类别标签采用标签向量表示,上述标签向量中包括总类别中各种类别标签对应的概率,上述根据第二特征矩阵和目标第一特征矩阵之间的相似度,确定训练图像对应的目标类别标签,包括:

8、计算第二特征矩阵和目标第一特征矩阵之间的第一相似度;

9、若第一相似度在第一阈值范围内,则将标签向量中训练图像的原始类别标签对应的概率设置为1以及将其他类别标签对应的概率设置为0,获得训练图像对应的目标类别标签;上述其他类别标签为总类别中除训练图像的原始类别标签之外的其他类别标签;

10、若第一相似度超出第一阈值范围,则计算第二特征矩阵和多个第一特征矩阵中的其他第一特征矩阵之间的第二相似度,并根据第二相似度和第二阈值范围,确定训练图像对应的目标类别标签;上述其他第一特征矩阵为多个第一特征矩阵中除目标第一特征矩阵之外剩余的第一特征矩阵;

11、其中,第一阈值范围对应的相似度大于第二阈值范围对应的相似度。

12、根据本专利技术提供的一种训练图像的标签确定方法,上述根据第二特征矩阵和目标第一特征矩阵之间的相似度,确定训练图像对应的目标类别标签之前,上述方法还包括:

13、获取第二特征矩阵中的最大值和最小值,以及获取目标第一特征矩阵中的最大值和最小值;

14、根据第二特征矩阵中的最大值和最小值,以及目标第一特征矩阵中的最大值和最小值,对第二特征矩阵进行特征拉伸处理,确定特征拉伸后的第二特征矩阵;上述拉伸后的第二特征矩阵与目标第一特征矩阵对应的特征值范围相同;

15、相应地,上述根据第二特征矩阵和目标第一特征矩阵之间的相似度,确定训练图像对应的目标类别标签,包括:

16、根据特征拉伸后的第二特征矩阵和目标第一特征矩阵之间的相似度,确定训练图像对应的目标类别标签。

17、根据本专利技术提供的一种训练图像的标签确定方法,上述根据特征拉伸后的第二特征矩阵和目标第一特征矩阵之间的相似度,确定训练图像对应的目标类别标签,包括:

18、根据特征拉伸后的第二特征矩阵,计算特征拉伸后的第二特征矩阵对应的均值和标准差;

19、获取预设的最大位数和最小位数,并根据最大位数、最小位数、均值以及标准差,对特征拉伸后的第二特征矩阵进行异常值剔除,确定异常值剔除后的第二特征矩阵;

20、根据异常值剔除后的第二特征矩阵和目标第一特征矩阵之间的相似度,确定训练图像对应的目标类别标签。

21、根据本专利技术提供的一种训练图像的标签确定方法,上述获取预设聚类算法对应的多个目标聚类参数,包括:

22、将多个训练图像按照各自的原始类别标签分为多类训练图像集;每类训练图像集包括一种类别标签下的训练图像;

23、对每类训练图像集中的训练图像分别进行距离计算处理,确定预设聚类算法对应的多个目标聚类参数。

24、根据本专利技术提供的一种训练图像的标签确定方法,上述多个目标聚类参数包括目标邻域半径和目标最小样本数,上述对每类训练图像集中的训练图像分别进行距离计算处理,确定预设聚类算法对应的多个目标聚类参数,包括:

25、针对每种类别标签,将类别标签对应的训练图像集输入至第二神经网络模型中,在第二神经网络模型中计算每两个训练图像之间的距离,获得训练图像集对应的多个第一距离,并根据多个第一距离,确定训练图像集对应的类别标签下的目标邻域半径;

26、针对每种类别标签,将类别标签对应的训练图像集中的训练图像,按照不同批次输入至第三神经网络模型中进行距离计算,确定不同批次各自对应的模型评价指标,并根据不同批次各自的模型评价指标,在不同批次中确定目标批次以及将目标批次对应的训练图像数量作为训练图像集对应的类别标签下的目标最小样本数。

27、根据本专利技术提供的一种训练图像的标签确定方法,上述多个目标聚类参数包括目标距离度量阈值,上述对每类训练图像集中的训练图像分别进行距离计算处理,确定预设聚类算法对应的多个目标聚类参数,包括:

28、针对每种类别标签,计算类别标签对应的训练图像集中每个训练图像与自身原始类别标签之间的距离,获得多个第二距离;

29、将多个第二距离中差异较大的第二距离剔除,并在剔除后的第二距离中选择众位数排序靠前的多个候选第二距离;

30、计算多个候选第二距离对应的平均值,根据平均值在多个候选第二距离中确定目标第二距离本文档来自技高网...

【技术保护点】

1.一种训练图像的标签确定方法,其特征在于,包括:

2.根据权利要求1所述的训练图像的标签确定方法,其特征在于,所述训练图像的目标类别标签采用标签向量表示,所述标签向量中包括总类别中各种类别标签对应的概率,所述根据所述第二特征矩阵和所述目标第一特征矩阵之间的相似度,确定所述训练图像对应的目标类别标签,包括:

3.根据权利要求1所述的训练图像的标签确定方法,其特征在于,所述根据所述第二特征矩阵和所述目标第一特征矩阵之间的相似度,确定所述训练图像对应的目标类别标签之前,所述方法还包括:

4.根据权利要求3所述的训练图像的标签确定方法,其特征在于,所述根据所述特征拉伸后的第二特征矩阵和所述目标第一特征矩阵之间的相似度,确定所述训练图像对应的目标类别标签,包括:

5.根据权利要求1至4任一项所述的训练图像的标签确定方法,其特征在于,所述获取预设聚类算法对应的多个目标聚类参数,包括:

6.根据权利要求5所述的训练图像的标签确定方法,其特征在于,所述多个目标聚类参数包括目标邻域半径和目标最小样本数,所述对每类所述训练图像集中的训练图像分别进行距离计算处理,确定所述预设聚类算法对应的多个目标聚类参数,包括:

7.根据权利要求5所述的训练图像的标签确定方法,其特征在于,所述多个目标聚类参数包括目标距离度量阈值,所述对每类所述训练图像集中的训练图像分别进行距离计算处理,确定所述预设聚类算法对应的多个目标聚类参数,包括:

8.一种训练图像的标签确定装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的训练图像的标签确定方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的训练图像的标签确定方法。

...

【技术特征摘要】

1.一种训练图像的标签确定方法,其特征在于,包括:

2.根据权利要求1所述的训练图像的标签确定方法,其特征在于,所述训练图像的目标类别标签采用标签向量表示,所述标签向量中包括总类别中各种类别标签对应的概率,所述根据所述第二特征矩阵和所述目标第一特征矩阵之间的相似度,确定所述训练图像对应的目标类别标签,包括:

3.根据权利要求1所述的训练图像的标签确定方法,其特征在于,所述根据所述第二特征矩阵和所述目标第一特征矩阵之间的相似度,确定所述训练图像对应的目标类别标签之前,所述方法还包括:

4.根据权利要求3所述的训练图像的标签确定方法,其特征在于,所述根据所述特征拉伸后的第二特征矩阵和所述目标第一特征矩阵之间的相似度,确定所述训练图像对应的目标类别标签,包括:

5.根据权利要求1至4任一项所述的训练图像的标签确定方法,其特征在于,所述获取预设聚类算法对应的多个目标聚类参数,包括:

6.根据权利要...

【专利技术属性】
技术研发人员:路通孙斌楼宏良陈波
申请(专利权)人:济南博观智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1