生成适应性训练图像数据集的方法及装置制造方法及图纸

技术编号:37485914 阅读:15 留言:0更新日期:2023-05-07 09:25
本发明专利技术提供能够提高预测准确度的生成适应性训练图像数据集的方法。所述方法包括:准备第一图像数据集,第一图像数据集包括多个第一图像和与多个第一图像各自对应的第一类别;以第一图像数据集为对象来执行学习算法,生成第一学习模型;准备第二图像数据集,第二图像数据集包括多个第二图像和与多个第二图像各自对应的第二类别;将第二图像输入于第一学习模型,获得与第二图像对应的预测类别;如果与第二图像对应的第二类别不同于预测类别,则确定第二图像与哪个类别的图像相似;根据确定结果来更新与第二图像对应的类别,由此更新第二图像数据集;以及以第一图像数据集和更新后的第二图像数据集为对象来执行学习算法,生成第二学习模型。二学习模型。二学习模型。

【技术实现步骤摘要】
生成适应性训练图像数据集的方法及装置


[0001]本专利技术涉及一种生成适应性训练图像数据集的方法及装置。

技术介绍

[0002]通过机器学习(即,深度学习)生成的学习模型的预测准确度受训练数据集的构成、模型架构(model architecture)及训练迭代次数等的影响。特别是,训练数据集的构成对预测准确度的影响最大。
[0003]这种训练数据集包括训练数据(training data)及与该数据对应的类别(Class)。也就是说,用户可以通过对训练数据属于哪个类别进行标注操作(labeling operation),来生成训练数据集。
[0004]通常,训练数据集按照事先所设计的来构成,因此无需额外的验证,即可用作学习算法的输入值。
[0005]然而,在制造领域中,与常规的训练数据集构成不同,难以事先定义类别并根据其来执行标注操作。这是因为,在运行设备前,难以预测会以何种形态产生不良。此外,即使事先定义类别并根据其来执行标注操作,但如果是多个用户进行标注操作,则会反映出多个用户各自的主观性。因此,需要针对完成的训练数据集进行验证操作。为了验证如此完成的训练数据集,需要大量的费用和工时。

技术实现思路

[0006]专利技术要解决的课题
[0007]本专利技术要解决的课题是提供能够提高预测准确度的生成适应性训练图像数据集的方法及装置。
[0008]本专利技术的课题不限于以上所提及的课题,本领域技术人员可以通过下面的描述更加清楚地理解未提及的其他课题。
[0009]解决课题的手段
[0010]用于解决上述课题的本专利技术的生成适应性训练图像数据集的方法的一个方面(aspect)包括:准备第一图像数据集,所述第一图像数据集包括多个第一图像和与所述多个第一图像各自对应的第一类别;以所述第一图像数据集为对象来执行学习算法,生成第一学习模型;准备第二图像数据集,所述第二图像数据集包括多个第二图像和与所述多个第二图像各自对应的第二类别;将所述第二图像输入于所述第一学习模型,获得与所述第二图像对应的预测类别;如果与所述第二图像对应的所述第二类别不同于所述预测类别,则确定所述第二图像与哪个类别的图像相似;根据确定结果来更新与所述第二图像对应的类别,由此更新所述第二图像数据集;以及以所述第一图像数据集和更新后的第二图像数据集为对象来执行学习算法,生成第二学习模型。
[0011]用于解决上述课题的本专利技术的生成适应性训练图像数据集的方法的另一方面包括:准备验证图像数据集,所述验证图像数据集包括多个验证图像和操作者对所述多个验
证图像分别进行分类而得到的手动类别;向学习模型输入验证图像,获得与所述验证图像对应的预测类别;如果所述预测类别和所述手动类别不同,则计算所述预测类别的代表图像与所述验证图像之间的第一相似度,并计算所述手动类别的代表图像与所述验证图像之间的第二相似度;如果所述第一相似度大于所述第二相似度,则将与所述验证图像对应的类别更新为所述预测类别,由此更新所述验证图像数据集;以及以更新后的所述验证图像数据集为对象来执行学习算法,增强所述学习模型。
[0012]用于解决上述另一个课题的本专利技术提供的装置的一个方面包括:处理器;以及存储器,所述存储器存储有第一图像数据集和第二图像数据集,所述第一图像数据集包括多个第一图像和与所述多个第一图像各自对应的第一类别,所述第二图像数据集包括多个第二图像和与所述多个第二图像各自对应的第二类别,所述存储器存储有指令(instructions),所述指令使所述处理器执行以下操作:以对所述第一图像数据集为对象来执行学习算法,生成第一学习模型;将所述第二图像输入于所述第一学习模型,获得与所述第二图像对应的预测类别;如果与所述第二图像对应的所述第二类别不同于所述预测类别,则确定所述第二图像与哪个类别的图像相似;根据确定结果来更新与所述第二图像对应的类别,由更新所述第二图像数据集;以及以所述第一图像数据集和更新后的第二图像数据集为对象来执行学习算法,生成第二学习模型。
[0013]其他实施例的具体事项包含在详细说明中及附图中。
附图说明
[0014]图1是用于说明根据本专利技术一些实施例的生成适应性训练图像数据集的方法的框图。
[0015]图2和图3是用于说明图1的步骤S10的图。
[0016]图4是用于说明图1的步骤S60的一例的图。
[0017]图5是用于说明图1的步骤S60的另一例的图。
[0018]图6是用于对用于执行根据本专利技术一些实施例的生成适应性训练图像数据集的方法的装置进行说明的框图。
[0019]附图标记说明
[0020]200:电子装置;
[0021]210:显示器;
[0022]220:处理器;
[0023]230:通信模块;
[0024]240:存储器;
[0025]250:总线。
具体实施方式
[0026]以下,参考附图详细说明本专利技术的优选实施例。通过参考附图和下面详细说明的实施例,本专利技术的优点和特征以及实现它们的方法将会变得清楚。但是,本专利技术不限于以下公开的实施例,还可以通过各种不同的形式来实现,本专利技术的实施例仅仅是为了完整地公开本专利技术,并向本领域普通技术人员完整地告知本专利技术的范畴,且本专利技术仅由权利要求的
范畴限定。在整个说明书中,相同的附图标记表示相同的构成要素。
[0027]空间上相对性术语“下面(below)”、“下方(beneath)”、“下部(lower)”、“上面(above)”、“上部(upper)”等,可以用于更容易地描述如图所示的一个元件或构成要素与其他元件或构成要素之间的相关关系。应当将空间上相对性术语理解为除了在图中所示的方向外还包括使用时或操作时元件的相互不同方向的术语。例如,将图中所示的元件翻转过来时,被描述为其他元件的“下面(below)”或“下方(beneath)”的元件可以放在其他元件的“上面(above)”。因此,示例性术语“下面”可以将下面和上面这两个方向均包括在内。元件还可以配向为其他方向,因此空间上相对性术语可以根据配向来解释。
[0028]尽管第一、第二等用于描述各种元件、构成要素和/或部分,但这些元件、构成要素和/或部分当然不受这些术语的限制。这些术语仅用于将一个元件、构成要素或部分与其他元件、构成要素或部分区分开。因此,在本专利技术的技术思想范围内,下文所提及的第一元件、第一构成要素或第一部分当然也可以是第二元件、第二构成要素或第二部分。
[0029]以下,将参考附图详细说明本专利技术的实施例,在参考附图的说明中,与附图标记无关地对相同或对应的构成要素赋予相同的附图标记,并省略对其的重复的说明。
[0030]图1是用于说明根据本专利技术一些实施例的生成适应性训练图像数据集的方法的框图。图2和图3是用于说明图1的步骤S10的图。图4是用于说明图1中步骤S60的一例的图。
[0031]参考图1,准备第一图像数据集(S10)。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生成适应性训练图像数据集的方法,包括:准备第一图像数据集,所述第一图像数据集包括多个第一图像和与所述多个第一图像各自对应的第一类别;以所述第一图像数据集为对象来执行学习算法,生成第一学习模型;准备第二图像数据集,所述第二图像数据集包括多个第二图像和与所述多个第二图像各自对应的第二类别;将所述第二图像输入于所述第一学习模型,获得与所述第二图像对应的预测类别;如果与所述第二图像对应的所述第二类别不同于所述预测类别,则确定所述第二图像与哪个类别的图像相似;根据确定结果来更新与所述第二图像对应的类别,由此更新所述第二图像数据集;以及以所述第一图像数据集和更新后的第二图像数据集为对象来执行学习算法,生成第二学习模型。2.根据权利要求1所述的生成适应性训练图像数据集的方法,其中,确定所述第二图像与哪个类别的图像相似包括:计算所述第二类别的代表图像与所述第二图像之间的第一相似度;计算所述预测类别的代表图像与所述第二图像之间的第二相似度;以及比较所述第一相似度与所述第二相似度。3.根据权利要求2所述的生成适应性训练图像数据集的方法,其中,计算所述第一相似度包括:计算出SSIM、即结构相似性指数图。4.根据权利要求2所述的生成适应性训练图像数据集的方法,其中,计算所述第一相似度包括:计算出PSNR、即峰值信噪比。5.根据权利要求2所述的生成适应性训练图像数据集的方法,其中,计算所述第一相似度包括:计算出SSIM与PSNR的加权和。6.根据权利要求2所述的生成适应性训练图像数据集的方法,其中,如果所述第一相似度大于所述第二相似度,则将与所述第二图像对应的类别更新为预测类别;以及如果所述第二相似度大于所述第一相似度,则与所述第二图像对应的类别维持第二类别。7.根据权利要求1所述的生成适应性训练图像数据集的方法,其中,确定所述第二图像与哪个类别的图像相似包括:计算多个代表图像各自与所述第二图像之间的多个相似度,所述多个代表图像各自对应于相互不同的类别。8.根据权利要求1所述的生成适应性训练图像数据集的方法,其中,所述第一类别和所述第二类别是由操作者确定的手动类别。9.根据权利要求1所述的生成适应性训练图像数据集的方法,其中,
所述第一图像和所述第二图像为喷墨图像,所述第一类别、所述第二类别及所述预测类别表示不良类型。10.一种生成适应性训练图像数据集的方法,包括:准备验证图像数据集,所述验证图像数据集包括多个验证图像和操作者对所述多个验证图像分别进行分类而得到的手动类别;向学习模型输入验证图像,获得与所述验证图像对应的预测类别;如果所述预测类别和所述手动类别不同,则计算所述预测类别的代表图像与所述验证图像之间的第一相似度,并计算所述手动类别...

【专利技术属性】
技术研发人员:柳志勋金光燮李钟民宋延彻吴埈昊朴永镐林名俊
申请(专利权)人:细美事有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1