数据生成装置、数据生成方法以及程序制造方法及图纸

技术编号:39263332 阅读:116 留言:0更新日期:2023-10-30 12:16
一种数据生成装置,生成对对象物进行判断的机器学习中的数据,所述数据生成装置具备:原始数据显示部,将实施数据增强的包含对象物的第一原数据显示于显示部;参数接收部,接收与数据增强相关的参数的输入;生成数据显示部,将生成数据显示于显示部,所述生成数据是通过基于参数对第一原数据中对象物以外的部分进行数据增强而生成的;以及可否采用接收部,接收是否采用基于参数的数据增强。接收是否采用基于参数的数据增强。接收是否采用基于参数的数据增强。

【技术实现步骤摘要】
【国外来华专利技术】数据生成装置、数据生成方法以及程序
[0001]关联申请的交叉引用
[0002]本申请基于2021年3月15日申请的日本申请号2021

40980号申请,并将其记载内容援引于此。


[0003]本专利技术涉及数据生成装置、数据生成方法以及程序。

技术介绍

[0004]为了构建机器学习模型,需要使用大量训练用数据进行训练。为了得到足够量的训练用数据,利用通过数据增强增加数据量的方法。
[0005]例如在引用文献1至3中记载有如下方法:通过数据增强对原来的训练用数据施加变化,由此从有限的原数据生成多种多样的训练用数据。
[0006]现有技术文献
[0007]专利文献
[0008]专利文献1:日本特开2020

34998号公报
[0009]专利文献2:日本特开2019

185483号公报
[0010]专利文献3:日本特开2020

166397号公报

技术实现思路

[0011]专利技术要解决的技术问题
[0012]例如在配合学习环境的差异来扩增训练数据的情况等下,大多能够根据使用者的想法在某种程度上设想进行怎样的数据增强为好。但是,在现有的方法中,不存在支持基于使用者的想法灵活地设定数据增强的方针的机制。
[0013]本专利技术是鉴于上述情况而完成的,其目的在于提供支持使用者确定数据增强的方针的机制。
[0014]用于解决技术问题的技术方案/>[0015]本专利技术为了解决上述技术问题而采用以下的构成。
[0016]本专利技术的一方面涉及的数据生成装置生成对对象物进行判断的机器学习中的数据,所述数据生成装置具备:原始数据显示部,将实施数据增强的包含所述对象物的第一原数据显示于显示部;参数接收部,接收与所述数据增强相关的参数的输入;生成数据显示部,将生成数据显示于所述显示部,所述生成数据是通过基于所述参数对所述第一原数据中所述对象物以外的部分进行所述数据增强而生成的;以及可否采用接收部,接收是否采用基于所述参数的所述数据增强。对象物是作为机器学习的利用目的的判断的对象。例如,可以举出图像识别中的识别对象(车辆识别中的车辆等)、声音识别中除噪声、环境音以外的声音数据、语义提取中的文本等应使学习模型能够不受数据获取环境、数据获取条件的影响地进行识别的对象物。
[0017]通过上述构成,能够边确认基于使用者所指定的参数的数据生成的结果的同时、边确定最终采用的参数,因此,能够高效地进行基于使用者的想法的数据增强。
[0018]另外,也可以是,具备生成数据保存部,在采用基于所述参数的所述数据增强的情况下,所述生成数据保存部保存所述生成数据。由此,能够将符合使用者的利用目的的生成数据保存为训练数据。
[0019]另外,也可以是,所述参数是与所述对象物以外的部分相关的信息和/或数据获取条件的变更方法。由此,能够使学习模型的识别对象等应在数据增强的前后不变的对象物不发生变化地增加训练数据的变化、或者转换为符合用途的训练数据。
[0020]另外,也可以是,所述参数是关于所述变更方法的程度的信息。由此,能够灵活地对变更程度的强弱、大小等进行变更。
[0021]另外,也可以是,还具备:参数存储部,将实施了所述数据增强时所使用的所述第一原数据作为第二原数据,并将采用该数据增强时的所述参数的信息与所述第二原数据相关联地加以存储;以及类似度计算部,计算在所述参数存储部中存储有所述参数的信息的所述第二原数据与欲实施所述数据增强的所述第一原数据的类似度,所述生成数据显示部基于与欲实施所述数据增强的所述第一原数据的类似度最高的第二原数据所关联的所述参数实施所述数据增强,并将所述生成数据显示于所述显示部。由此,能够基于过去的记录对类似的数据提示同样的数据增强的参数,因此,能够使使用者的作业进一步高效化。
[0022]另外,也可以是,还具备:利用目的接收部,接收通过所述数据增强而生成的所述生成数据的利用目的的输入;以及参数存储部,将采用所述数据增强时的所述参数的信息与所述利用目的相关联地加以存储,所述生成数据显示部基于与输入的所述利用目的一致的利用目的所关联的所述参数实施所述数据增强,并将所述生成数据显示于所述显示部。由此,能够根据使用训练数据的学习模型的种类等选择利用目的,并基于过去的记录效率优良地确定数据增强的方针。
[0023]另外,也可以是,所述第一原数据是图像数据,所述参数是拍摄距离的变更、拍摄角度的变更、拍摄时刻的变更、背景图像的变更以及拍摄时的天气条件的变更中的至少一者。由此,能够效率优良地进行图像识别模型等的训练数据的生成。
[0024]另外,也可以是,所述第一原数据是声音数据或波形数据,所述参数是环境音赋予及噪声赋予中的至少一个变更方法。由此,能够效率优良地进行声音识别模型等的训练数据的生成。
[0025]另外,也可以是,所述第一原数据是文本数据,所述参数是替换、词序交换以及感叹词赋予中的至少一个变更方法。由此,能够效率优良地进行语义分析模型等的训练数据的生成。
[0026]另外,也可以是,还具备:原始数据存储部,存储包含多个第一原数据的一个以上的数据集;以及数据集指定接收部,接收实施所述数据增强的数据集的指定,所述生成数据显示部显示对所指定的数据集中包含的多个第一原数据之一实施的所述数据增强的结果,在采用所述数据增强的情况下,所述生成数据保存部对于该数据集中包含的全部第一原数据实施所采用的所述数据增强,并保存全部的生成数据。由此,能够对在相同的环境或获取条件下得到的多个原数据集中实施数据增强。
[0027]本专利技术的一方面涉及的数据生成方法是由计算机生成对对象物进行判断的机器
学习中的数据的数据生成方法,所述数据生成方法包括以下工序:计算机将实施数据增强的包含所述对象物的第一原数据显示于显示部;计算机接收与所述数据增强相关的参数的输入;计算机将通过基于所述参数对所述第一原数据中所述对象物以外的部分进行所述数据增强而生成的生成数据显示于所述显示部;以及计算机接收是否采用基于所述参数的所述数据增强。
[0028]通过上述构成,能够边确认基于使用者所指定的参数的数据生成的结果的同时、边确定最终采用的参数,因此,能够高效地进行基于使用者的想法的数据增强。
[0029]本专利技术的一方面涉及的程序使生成对对象物进行判断的机器学习中的数据的计算机作为原始数据显示部、参数接收部、生成数据显示部以及可否采用接收部发挥功能,所述原始数据显示部将实施数据增强的包含所述对象物的第一原数据显示于显示部,所述参数接收部接收与所述数据增强相关的参数的输入,所述生成数据显示部将通过基于所述参数对所述第一原数据中所述对象物以外的部分进行所述数据增强而生成的生成数据显示于所述显示部,所述可否采用接收部接收是否采用基于所述参数的所述数据增强。
[0030]通过上述构成,能够边确认基于使用者所指定的参数的数据生成的结果的同时、边本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种数据生成装置,生成对对象物进行判断的机器学习中的数据,所述数据生成装置具备:原始数据显示部,将实施数据增强的包含所述对象物的第一原数据显示于显示部;参数接收部,接收与所述数据增强相关的参数的输入;生成数据显示部,将生成数据显示于所述显示部,所述生成数据是通过基于所述参数对所述第一原数据中所述对象物以外的部分进行所述数据增强而生成的;以及可否采用接收部,接收是否采用基于所述参数的所述数据增强。2.根据权利要求1所述的数据生成装置,其中,所述数据生成装置具备生成数据保存部,在采用基于所述参数的所述数据增强的情况下,所述生成数据保存部保存所述生成数据。3.根据权利要求1或2所述的数据生成装置,其中,所述参数是与所述对象物以外的部分相关的信息和/或数据获取条件的变更方法。4.根据权利要求3所述的数据生成装置,其中,所述参数是关于所述变更方法的程度的信息。5.根据权利要求1至4中任一项所述的数据生成装置,其中,所述数据生成装置还具备:参数存储部,将实施了所述数据增强时所使用的所述第一原数据作为第二原数据,并将采用该数据增强时的所述参数的信息与所述第二原数据相关联地加以存储;以及类似度计算部,计算在所述参数存储部中存储有所述参数的信息的所述第二原数据与欲实施所述数据增强的所述第一原数据的类似度,所述生成数据显示部基于与欲实施所述数据增强的所述第一原数据的类似度最高的第二原数据所关联的所述参数实施所述数据增强,并将所述生成数据显示于所述显示部。6.根据权利要求1至5中任一项所述的数据生成装置,其中,所述数据生成装置还具备:利用目的接收部,接收通过所述数据增强而生成的所述生成数据的利用目的的输入;以及参数存储部,将采用所述数据增强时的所述参数的信息与所述利用目的相关联地加以存储,所述生成数据显示部基于与输入的所述利用目的一致的利用目的所关联的所述参数实施所述数据增强,并将所述生成数据显示于所述显示部。7.根据权利要求3所述的数据生成装置,其中,...

【专利技术属性】
技术研发人员:広桥佑纪武良盛太郎宫本真实桥本敦史徳隆宏土屋直树井尻善久冈本大和
申请(专利权)人:欧姆龙株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1