一种样本库一致性确定方法、装置、介质及计算设备制造方法及图纸

技术编号:33288205 阅读:15 留言:0更新日期:2022-05-01 00:00
本发明专利技术公开一种样本库一致性确定方法、装置、介质及计算设备,其中该方法包括:获取样本库,并对所述样本库中的全部样本进行标注样本类别;基于所述样本库中任一待确定的样本类别,以及所述样本库的其他样本类别,从所述样本库中任选两种类别的全部样本组成样本集;将所述样本集划分成训练集和测试集,基于所述训练集和测试集确定所述样本库中任一待确定的样本类别的一致性。本方案能够对样本库行评价,得出各个类别的一致性,各个类别一致性结果是基于样本库本身各个样本自身的特征维度进行评价的,更加符合分类网络的深度学习算法的识别逻辑,在获知待确定样本库各个类别的一致性高低后就可以针对性的进行设计、优化分类网络。网络。网络。

【技术实现步骤摘要】
一种样本库一致性确定方法、装置、介质及计算设备


[0001]本专利技术涉及深度学习领域,特别涉及一种样本库一致性确定方法、装置、介质及计算设备。

技术介绍

[0002]在计算机视觉中利用分类网络来进行图像分类,而分类网络需要使用样本库进行训练,以学习特征与类别之间的关系,才能够对图像进行分类,对于训练作用的样本库来说,样本库一致性越高,其中的样本越易于区分,所需要的分类网络则愈简单,而样本库一致性越低,则所需要的分类网络愈复杂。目前在确定分类网络的性能时,大多是从分类网络本身的算法出发,利用一些指定好的指标对数据集进行评价,得出分类网络的稳定性、准确性等等。

技术实现思路

[0003]本专利技术的主要目的是提出一种样本库一致性确定方法、装置、介质及计算设备,旨在解决
技术介绍
中所提到的问题。
[0004]为实现上述目的,本专利技术提出一种样本库一致性确定方法,包括:
[0005]获取样本库;
[0006]从所述样本库中任选两种类别的全部样本组成样本集;
[0007]将所述样本集划分成训练集和测试集,基于所述训练集和测试集确定所述样本库中某一类别待确定的样本的一致性。
[0008]在本实施方式的一实施例中,从所述样本库中任选两种类别的全部样本组成样本集,包括:
[0009]基于所述样本库中任一待确定的样本类别,分别与所述样本库中的全部其他样本类别组成多个所述样本集。
[0010]在本实施方式的一实施例中,将所述样本集划分成训练集和测试集,基于所述训练集和测试集确定所述样本库中任一待确定的样本类别的一致性,包括:
[0011]从所述待确定的样本类别所对应的多个所述样本集中选取任一样本集;
[0012]按照预设次数,将所述样本集划分成训练集和测试集;
[0013]基于多次划分成的多组训练集和测试集,确定所述待确定的样本类别在每次划分后的一致性结果;
[0014]基于每次划分后的一致性结果确定所述待确定的样本类别在所选取的样本集中的一致性结果。
[0015]在本实施方式的一实施例中,在得到每次划分后的一致性结果后还包括:
[0016]判断划分是否达到预设次数,
[0017]若是,则遍历所述待确定的样本类别所对应的多个样本集,得到所述待确定的样本类别在所对应的多个所述样本集中的各个一致性结果;
[0018]基于所述待确定的样本类别在所对应的多个样本集中的各个一致性结果,得到所述待确定的样本类别在所述样本库中的一致性结果。
[0019]在本实施方式的一实施例中,基于每次划分成的训练集和测试集,确定所述待确定的样本类别在每次划分后的一致性结果,包括:
[0020]利用每次划分成的训练集对分类网络进行训练,基于训练后的分类网络对所述训练集对应的测试集进行分类,得到分类结果;
[0021]基于所述分类结果确定所述待确定的样本类别在每次划分后的一致性结果。
[0022]在本实施方式的一实施例中,利用每次划分成的所述训练集对分类网络进行训练,基于训练后的分类网络对所述训练集对应的测试集进行分类,得到分类结果,包括:
[0023]将每次划分成的训练集输入分类网络,训练得到所述分类网络的权重参数;
[0024]利用所述分类网络按照所述权重参数对所述测试集进行分类,得到分类结果。
[0025]在本实施方式的一实施例中,通过如下方法确定所述待确定的样本类别在每次划分后的一致性结果:
[0026]在每次划分中,计算利用训练后的分类网络在测试集上分类识别出的所述待确定的样本类别在所述测试集中所占的识别比例,以及该类别样本在测试集中所占的真实比例;
[0027]将每次划分中所述识别比例和所述真实比例中的最小值与最大值的比值,作为每次划分中所述待确定的样本类别的一致性结果。
[0028]在本实施方式的一实施例中,所述训练集中两种类样本的比例,与所述测试集中两种类样本的比例相同。
[0029]本专利技术还提出一种样本库一致性确定装置,包括:
[0030]获取模块,用于获取样本库;
[0031]分类模块,用于从所述样本库中任选两种类别的全部样本组成样本集;
[0032]评价模块,用于将所述样本集划分成训练集和测试集,并基于所述训练集和测试集确定所述样本库中某一待确定的样本类别的一致性。
[0033]在本实施方式的一实施例中,所述分类模块被配置为:
[0034]基于所述样本库中任一待确定的样本类别,分别与所述样本库中的全部其他样本类别组成多个所述样本集。
[0035]在本实施方式的一实施例中,所述评价模块包括:
[0036]循环模块,用于从所述待确定的样本类别所对应的多个所述样本集中选取任一样本集;
[0037]划分模块,用于按照预设次数,将所述样本集划分成训练集和测试集;
[0038]计算模块,用于基于每次划分成的训练集和测试集,确定所述待确定的样本类别在每次划分后的一致性结果;
[0039]判断模块,基于每次划分后的一致性结果确定所述待确定的样本类别在所选取的样本集中的一致性结果。
[0040]在本实施方式的一实施例中,所述循环模块还被配置为:当所述判断模块判断在某次划分后的一致性结果稳定后,从所述待确定的样本类别所对应的多个样本集中选取另一个样本集,直至遍历所述待确定的样本类别所对应的多个样本集;
[0041]所述计算模块还被配置为:计算所述待确定的样本类别在所对应的多个所述样本集中的各个一致性结果,并基于所述待确定的样本类别在所对应的多个样本集中的各个一致性结果,得到所述待确定的样本类别在所述样本库中的一致性结果。
[0042]在本实施方式的一实施例中,所述评价模块还包括:
[0043]训练模块,被配置为利用每次划分成的训练集对分类网络进行训练;
[0044]测试模块,被配置为基于训练后的分类网络对所述训练集对应的测试集进行分类,得到分类结果;
[0045]所述计算模块还被配置为基于所述分类结果确定待确定的样本类别在每次划分后的一致性结果。
[0046]在本实施方式的一实施例中,所述训练模块还被配置为:将每次划分成的训练集输入分类网络,训练得到所述分类网络的权重参数;
[0047]所述测试模块还被配置为:利用所述分类网络按照所述权重参数对所述测试集进行分类,得到分类结果。
[0048]在本实施方式的一实施例中,所述计算模块还被配置为:
[0049]在每次划分中,计算利用训练后的分类网络在测试集上分类识别出的所述待确定的样本类别在所述测试集中所占的识别比例,以及该类别样本在测试集中所占的真实比例;
[0050]将每次划分中所述识别比例和所述真实比例中的最小值与最大值的比值,作为每次划分中所述待确定的样本类别的一致性结果。
[0051]在本实施方式的一实施例中,所述划分模块被配置为:将所述训练集中两种类样本的比例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种样本库一致性确定方法,包括:获取样本库;从所述样本库中任选两种类别的全部样本组成样本集;将所述样本集划分成训练集和测试集,基于所述训练集和测试集确定所述样本库中某一类别样本的一致性。2.如权利要求1所述的样本库一致性确定方法,其中,从所述样本库中任选两种类别的全部样本组成样本集,包括:基于所述样本库中任一待确定的样本类别,分别与所述样本库中的全部其他样本类别组成多个所述样本集。3.如权利要求2所述的样本库一致性确定方法,其中,将所述样本集划分成训练集和测试集,基于所述训练集和测试集确定所述样本库中某一样本类别样本的一致性,包括:从所述待确定的样本类别所对应的多个所述样本集中选取任一样本集;按照预设次数,将所述样本集进行划分成训练集和测试集;基于每次划分成的训练集和测试集,确定所述待确定的样本类别在每次划分后的一致性结果;基于每次划分后的一致性结果确定所述待确定的样本类别在所选取的样本集中的一致性结果。4.如权利要求3所述的样本库一致性确定方法,其中,在得到每次划分后的一致性结果后还包括:判断划分是否达到预设次数,若是,则遍历所述待确定的样本类别所对应的多个样本集,得到所述待确定的样本类别在所对应的多个所述样本集中的各个一致性结果;基于所述待确定的样本类别在所对应的多个样本集中的各个一致性结果,得到所述待确定的样本类别在所述样本库中的一致性结果。5.一种样本库一致性确定装置,包括:获取模块,用于获取样本库;分类模块,用于从所述样本库中任选两种类别的全部样本组成样本集;评价模块,用于将所述样本集划分成训练集和测试集,并基于所述训练集和测试集确...

【专利技术属性】
技术研发人员:姚照原崔要奎万玮马磊王卫红张鑫龙
申请(专利权)人:中国电子科技集团公司电子科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1