样本图像确定方法和装置、电子设备及存储介质制造方法及图纸

技术编号:20486520 阅读:22 留言:0更新日期:2019-03-02 19:38
本公开是关于一种样本图像确定方法和装置、电子设备及存储介质,其中所述方法包括:采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;分别将所述各样本图像对应的预测向量转化成概率向量;依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。本公开提供的样本图像确定能够准确、快速的从多个样本图像中提取从困难样本图像,并且无需人工手动干预,能够节省人力资源。

【技术实现步骤摘要】
样本图像确定方法和装置、电子设备及存储介质
本公开涉及图像处理
,尤其涉及一种样本图像确定方法和装置、电子设备及存储介质。
技术介绍
近来,深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。卷积神经网络作为深度学习的一个重要分支,由于其超强的拟合能力以及端到端的全局优化能力,使得视频图像分类任务在应用卷积神经网络之后,预测精度大幅提升。虽然目前图像分类模型对图像具有了一定的分类能力,但是仍然会有大量预测错误的样本图像,如何进一步优化图像分类模型成为一个需要解决的问题。在训练图像分类模型时,困难样本图像的作用往往大于简单样本图像。在图像分类模型的学习过程中即便是大量的简单样本图像都很难对图像分类模型的预测精度带来大幅度提升,而困难样本图像往往会给图像分类模型的预测精度带来较大幅度的提升。可见,目前迫切需要本领域技术人员解决的技术问题为,如何从大量样本图像中提取困难样本图像,从而通过困难样本图像对图像分类模型进行训练。
技术实现思路
为克服相关技术中存在的问题,本公开提供了一种样本图像确定方法和装置、电子设备及存储介质。根据本公开实施例的第一方面,提供一种样本图像确定方法,包括:采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;分别将所述各样本图像对应的预测向量转化成概率向量;依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。可选地,所述采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量,包括:针对每个样本图像,分别采用所述第一预设数量的分类器对各样本图像进行预测,得到所述第一预设数量个分类标签,其中,一个分类器对一个样本图像进行预测时生成一个分类标签;依据所述第一预设数量个分类标签,生成所述样本图像对应的预测向量。可选地,所述分别将所述各样本图像对应的预测向量转化成概率向量,包括:针对每个样本图像,确定所述样本图像对应的预测向量中各分类标签出现的次数;针对所述预测向量中出现的每个分类标签,依据所述分类标签出现的次数和所述预测向量中的分类标签总个数,确定所述分类标签对应的概率值;依据所述预测向量中出现的所述各分类标签和所述各分类标签对应的概率值,生成所述预测向量对应的概率向量。可选地,所述依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像,包括:分别计算各所述样本图像对应的概率向量的信息熵,其中,每个样本图像对应一个信息熵;依据所述各样本图像对应的信息熵,确定所述各样本图像中的困难样本图像。可选地,所述依据所述各样本图像对应的信息熵,确定所述各样本图像中的困难样本,包括:将所述各样本图像对应的信息熵按照从大到小进行排序;将排序在前的第二预设数量个信息熵对应的样本图像确定为所述困难样本图像。可选地,在所述采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量之前,所述方法还包括:随机初始化所述第一预设数量个分类器。根据本公开实施例的第二方面,提供一种样本图像确定装置,包括:预测向量生成模块,被配置为采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;转化模块,被配置为分别将所述各样本图像对应的预测向量转化成概率向量;确定模块,被配置为依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。可选地,所述预测向量生成模块包括:分类标签确定子模块,被配置为针对每个样本图像,分别采用所述第一预设数量的分类器对所述样本图像进行预测,得到所述第一预设数量个分类标签,其中,一个分类器对所述样本图像进行预测时生成一个分类标签;生成子模块,被配置为依据所述第一预设数量个分类标签,生成所述样本图像对应的预测向量。可选地,所述转化模块包括:次数确定子模块,被配置为针对每个样本图像,确定所述样本图像对应的预测向量中各分类标签出现的次数;概率值确定子模块,被配置为针对所述预测向量中出现的每个分类标签,依据所述分类标签出现的次数和所述预测向量中的分类标签总个数,确定所述分类标签对应的概率值;向量生成子模块,被配置为依据所述预测向量中出现的所述各分类标签和所述各分类标签对应的概率值,生成所述预测向量对应的概率向量。可选地,所述确定模块包括:计算子模块,被配置为分别计算各所述样本图像对应的概率向量的信息熵,其中,每个样本图像对应一个信息熵;困难样本图像确定子模块,被配置为依据所述各样本图像对应的信息熵,确定所述各样本图像中的困难样本图像。可选地,所述困难样本图像确定子模块包括:排序单元,被配置为将所述各样本图像对应的信息熵按照从大到小进行排序;困难样本图像确定单元,被配置为将排序在前的第二预设数量个信息熵对应的样本图像确定为所述困难样本图像。可选地,所述装置还包括:初始化模块,被配置为在所述预测向量生成模块在所述采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量之前,随机初始化所述第一预设数量个分类器。根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述任一种样本图像确定方法。根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备执行上述任一种样本图像确定方法。根据本公开实施例的第五方面,提供根据一种计算机程序产品,当所述计算机程序产品中的指令由电子设备的处理器执行时,使得移电子设备执行上述任一种样本图像确定方法。本公开的实施例提供的技术方案可以包括以下有益效果:本公开实施例提供的样本图像确定方案,通过多个分类器分别对各样本图像进行预测得到预测向量,将预测向量转化为概率向量,然后依据各样本图像对应的概率向量来确定各样本图像中的困难样本图像,该种方式能够准确、快速的从多个样本图像中提取从困难样本图像,并且无需人工手动干预,能够节省人力资源。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种样本图像确定方法的步骤流程图;图2是根据一示例性实施例示出的一种样本图像确定方法的步骤流程图;图3是根据一示例性实施例示出的一种样本图像确定装置的框图;图4是根据一示例性实施例示出的一种电子设备的结构框图;图5是根据一示例性实施例示出的一种电子设备的结构框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种样本图像确定方法的流程图,如图1所示样本图像确定方法用于电子设备中,包括以下步骤:步骤101:采用第一预设数量的分类器分别对各样本图像进行预测,得到各样本图像对应的预测向量。分类器即图像分类模型,分类器可以本文档来自技高网...

【技术保护点】
1.一种样本图像确定方法,其特征在于,所述方法包括:采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;分别将所述各样本图像对应的预测向量转化成概率向量;依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。

【技术特征摘要】
1.一种样本图像确定方法,其特征在于,所述方法包括:采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;分别将所述各样本图像对应的预测向量转化成概率向量;依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。2.根据权利要求1所述的方法,其特征在于,所述采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量,包括:针对每个样本图像,分别采用所述第一预设数量的分类器对各样本图像进行预测,得到所述第一预设数量个分类标签,其中,一个分类器对一个样本图像进行预测时生成一个分类标签;依据所述第一预设数量个分类标签,生成所述样本图像对应的预测向量。3.根据权利要求1所述的方法,其特征在于,所述分别将所述各样本图像对应的预测向量转化成概率向量,包括:针对每个样本图像,确定所述样本图像对应的预测向量中各分类标签出现的次数;针对所述预测向量中出现的每个分类标签,依据所述分类标签出现的次数和所述预测向量中的分类标签总个数,确定所述分类标签对应的概率值;依据所述预测向量中出现的所述各分类标签和所述各分类标签对应的概率值,生成所述预测向量对应的概率向量。4.根据权利要求1所述的方法,其特征在于,所述依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像,包括:分别计算各所述样本图像对应的概率向量的信息熵,其中,每个样本图像对应一个信息熵;依据所述各样本图像对应的信息熵,确定所述各样本图像中的困难样本图像。5.根据权利要求4所述的方法,其特征在于,所述依...

【专利技术属性】
技术研发人员:张志伟王希爱王树强
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1