构建样本图像集的方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:33885794 阅读:9 留言:0更新日期:2022-06-22 17:18
本公开提供了一种构建样本图像集的方法、装置、电子设备及可读存储介质,涉及深度学习、计算机视觉等人工智能技术领域,可应用于人脸图像处理、人脸识别等场景。其中,构建样本图像集的方法包括:将至少两张样本图像划分为至少两个第一样本图像集;获取清晰图像集与模糊图像集;根据所述清晰图像集、所述模糊图像集与至少两个所述第一样本图像集,构建与每个所述第一样本图像集对应的第二样本图像集。本公开能够提升所构建的第二样本图像集的准确性。能够提升所构建的第二样本图像集的准确性。能够提升所构建的第二样本图像集的准确性。

【技术实现步骤摘要】
构建样本图像集的方法、装置、电子设备及可读存储介质


[0001]本公开涉及深度学习、计算机视觉等人工智能
,可应用于人脸图像处理、人脸识别等场景。具体提供了一种构建样本图像集的方法、装置、电子设备及可读存储介质。

技术介绍

[0002]随着人工智能技术的发展,图像的清晰度识别越来越受到人们的关注。在相关技术中,通常使用图像分类模型的方式,由图像分类模型对所输入的图像进行清晰或者模糊的分类。但是,在使用训练数据来训练神经网络模型得到图像分类模型时,通常是直接使用由训练数据所划分的多个batch来训练神经网络模型,导致训练得到的图像分类模型的分类准确性较低。

技术实现思路

[0003]根据本公开的第一方面,提供了一种构建样本图像集的方法,包括:将至少两张样本图像划分为至少两个第一样本图像集;获取清晰图像集与模糊图像集;根据所述清晰图像集、所述模糊图像集与至少两个所述第一样本图像集,构建与每个所述第一样本图像集对应的第二样本图像集。
[0004]根据本公开的第二方面,提供了一种构建样本图像集的装置,包括:划分单元,用于将至少两张样本图像划分为至少两个第一样本图像集;获取单元,用于获取清晰图像集与模糊图像集;构建单元,用于根据所述清晰图像集、所述模糊图像集与至少两个所述第一样本图像集,构建与每个所述第一样本图像集对应的第二样本图像集。
[0005]根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
[0006]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
[0007]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
[0008]由以上技术方案可以看出,本公开使用所获取的清晰图像集与模糊图像集,对划分样本图像所得到的第一样本图像集进行处理,从而重新构建与第一样本图像集对应的第二样本图像集,使得第二样本图像集能够对样本图像的难易程度进行综合考虑,从而平衡第二样本图像集中的难、易样本的比例,提升所构建的第二样本图像集的准确性,并相应地提升通过第二样本图像集训练得到的图像分类模型的分类准确性。
[0009]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0010]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0011]图1是根据本公开第一实施例的示意图;
[0012]图2是根据本公开第二实施例的示意图;
[0013]图3是根据本公开第三实施例的示意图;
[0014]图4是用来实现本公开实施例的构建样本图像集的方法的电子设备的框图。
具体实施方式
[0015]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和机构的描述。
[0016]图1是根据本公开第一实施例的示意图。如图1所示,本实施例的构建样本图像集的方法,具体包括如下步骤:
[0017]S101、将至少两张样本图像划分为至少两个第一样本图像集;
[0018]S102、获取清晰图像集与模糊图像集;
[0019]S103、根据所述清晰图像集、所述模糊图像集与至少两个所述第一样本图像集,构建与每个所述第一样本图像集对应的第二样本图像集。
[0020]本实施例的构建样本图像集的方法,使用所获取的清晰图像集与模糊图像集,对划分样本图像所得到的第一样本图像集再进行处理,从而重新构建与第一样本图像集对应的第二样本图像集,使得第二样本图像集能够对样本图像的难易程度进行综合考虑,从而平衡第二样本图像集中的难、易样本的比例,提升所得到的第二样本图像集的准确性,并相应地提升通过第二样本图像集训练得到的图像分类模型的分类准确性。
[0021]本实施例在执行S101时,首先获取至少两张样本图像,然后再将所获取的至少两张样本图像划分为至少两个第一样本图像集;其中,至少两张样本图像可以为至少两张包含人脸的图像,也可以为至少两张不包含人脸的普通图像;本实施例执行S101获取的每张样本图像还会具有标注标签,样本图像的标注标签为清晰标签与模糊标签中的一种。
[0022]本实施例执行S101划分得到的每个第一样本图像集包含的样本图像的数量,可以相同,也可以不同。
[0023]具体地,本实施例在执行S101将至少两张样本图像划分为至少两个第一样本图像集时,可以采用的可选实现方式为:确定目标样本数量,本实施例可以将预设数量作为目标样本数量,目标样本数量即为每个第一样本图像集中包含的样本图像的数量;根据所确定的目标样本数量,将至少两张样本图像划分为至少两个第一样本图像集,从而使得每个第一样本图像集均包含对应目标样本数量的样本图像。
[0024]也就是说,本实施例通过对样本图像进行划分,所得到的每个第一样本图像集即为一个batch,目标样本数量即为batch size,从而根据预设的batch size,将至少两张样本图像划分为多个包含相同数量的样本图像的batch。
[0025]本实施例在执行S101时,还可以通过从至少两张样本图像中选取随机数量的样本图像的方式,来构成一个第一样本图像集,从而将至少两张样本图像划分为多个包含不同
数量的样本图像的第一样本至少两张样本图像集。
[0026]本实施例在执行S101将至少两张样本图像划分为至少两个第一样本图像集之后,执行S102获取清晰图像集与模糊图像集;其中,本实施例执行S102获取的清晰图像集中包含多张清晰样本图像,模糊图像集中包含多张模糊样本图像。
[0027]本实施例在执行S102时,可以直接获取预设的两个图像集,分别作为清晰图像集与模糊图像集。
[0028]本实施例在执行S102获取清晰图像集与模糊图像集时,可以采用的可选实现方式为:从至少两个第一样本图像集中获取第三样本图像集,本实施例可以将从至少两个第一样本图像集中随机选取的一个,作为第三样本图像集,也可以根据输入端的输入或者选择来选取一个,作为第三样本图像集;根据第三样本图像集中具有清晰标签的样本图像,生成清晰图像集;根据第三样本图像集中具有模糊标签的样本图像,生成模糊图像集。
[0029]也就是说,本实施例可以根据第一样本图像集中样本图像的标注标签,获取清晰图像集与模糊图像集,使得所获取的图像集与所获取的至少本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种构建样本图像集的方法,包括:将至少两张样本图像划分为至少两个第一样本图像集;获取清晰图像集与模糊图像集;根据所述清晰图像集、所述模糊图像集与至少两个所述第一样本图像集,构建与每个所述第一样本图像集对应的第二样本图像集。2.根据权利要求1所述的方法,其中,所述获取清晰图像集与模糊图像集包括:从至少两个所述第一样本图像集中获取第三样本图像集;根据所述第三样本图像集中具有清晰标签的样本图像,生成所述清晰图像集;根据所述第三样本图像集中具有模糊标签的样本图像,生成所述模糊图像集。3.根据权利要求1

2中任一项所述的方法,其中,所述根据所述清晰图像集、所述模糊图像集与至少两个所述第一样本图像集,构建与每个所述第一样本图像集对应的第二样本图像集包括:针对每个第一样本图像集中的每张样本图像,根据该样本图像的标注标签,确定所述清晰图像集与所述模糊图像集中的目标图像集;计算该样本图像与所述目标图像集之间的目标相似度;在确定所述目标相似度满足预设要求的情况下,将该样本图像添加到所述目标图像集;在完成对该第一样本图像集中每张样本图像的上述处理之后,分别从该第一样本图像集、以及添加样本图像之后的清晰图像集与模糊图像集中选取样本图像,构建与该第一样本图像集对应的第二样本图像集。4.根据权利要求3所述的方法,其中,所述计算该样本图像与所述目标图像集之间的目标相似度包括:获取该样本图像、以及所述目标图像集中每张目标样本图像的图像特征;根据所获取的图像特征,计算该样本图像与每张目标样本图像之间的相似度;根据该样本图像与每张目标样本图像之间的相似度,得到该样本图像与所述目标图像集之间的目标相似度。5.根据权利要求3所述的方法,还包括,在将该样本图像添加到所述目标图像集之后,获取所述目标图像集中目标样本图像的图像数量;在确定所述图像数量超过图像阈值的情况下,将所述目标图像集中的目标样本图像进行删除。6.根据权利要求3所述的方法,其中,所述分别从该第一样本图像集、以及添加样本图像之后的清晰图像集与模糊图像集中选取样本图像包括:获取该第一样本图像集中样本图像的图像数量;根据所述图像数量与预设比例,分别从该第一样本图像集、以及添加样本图像之后的清晰图像集与模糊图像集中选取样本图像。7.一种构建样本图像集的装置,包括:划分单元,用于将至少两张样本图像划分为至少两个第一样本图像集;获取单元,用于获取清晰图像集与模糊图像集;
构建单元,用于根据所述清晰图像集、所述模糊图像集与至少两个所述第一样本图像集,构建与每个所述第一样本图像集对应的第二样本图像集。8.根据权利要求7所述的装置,其中,所述获取单元在获取清晰图像集与模糊图像集时,具体执行...

【专利技术属性】
技术研发人员:何斌
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1