【技术实现步骤摘要】
【国外来华专利技术】数据生成装置、预测器学习装置、数据生成方法和学习方法本申请主张平成31年(2019年)1月10日申请的日本申请即特愿2019-2436的优先权,通过参照其内容,编入本申请。
本专利技术涉及生成机器学习中使用的数据的数据生成装置。
技术介绍
目前,应用了机器学习的系统、服务正在普及。例如,许多企业通过运用装置、设备、车辆等多种多样的物理的资产(asset),来进行经济活动。这些资产由于电气的或机械的原因而有时不正常或发生故障。因此,适当通过预测的或应对措施即零件及消耗品的更换、单元的更换及修缮等而在运用上不会产生大的故障是重要的。但是,由于资产的复杂化、以及熟练的保养员或修理工的短缺等,有时无法采取适当的措施。因此,正在研究一种系统,其通过基于过去的运转实绩及修理历史等信息来推荐适当的措施,补充保养员或操作员的作业,能够实现资产稳定地运转。在上述的应用了机器学习的系统及服务中,预测器是根据关于输入及输出的训练数据集合,基于学习其输入输出的关系性的被称为监督学习或半监督学习的框架来构建的。该预测器对于训练数据集合中未包含的数据要求高的预测性能(通用性能)。因此,目前提出了以神经网络为代表的预测器的各种模型。另一方面,作为另一种方法,有通过使将训练数据集合适当地变形或变换而得到的伪数据集合与原始的训练数据集合一起用于学习,以实现通用性能提高的方法。将这种伪数据生成称为数据扩充。例如,通常来说,如果为图像,则可以通过对训练数据集合进行旋转、扩大、缩小、移动等变形来扩充数据。然而,就上述的运转实绩及修理 ...
【技术保护点】
1.一种生成数据集合的数据生成装置,其特征在于,包括:/n扰动生成部,其基于训练数据集合的各元素的输入和关于所述训练数据集合的信息这两者中的至少一者,来生成用于使所述元素变形的扰动集合;/n伪数据合成部,其根据所述训练数据集合和所述扰动集合,来生成与所述训练数据集合不同的新的伪数据集合;/n评价部,其计算所述训练数据集合和所述伪数据集合的分布间距离或关于其的推算量,以及从所述扰动集合得到的伪数据相对于训练数据的扰动的大小;和/n参数更新部,其更新所述扰动生成部生成所述扰动集合时所使用的参数,以使所述训练数据集合与所述伪数据集合的分布间距离相接近,使扰动的大小或期待值成为预定的目标值。/n
【技术特征摘要】
【国外来华专利技术】20190110 JP 2019-0024361.一种生成数据集合的数据生成装置,其特征在于,包括:
扰动生成部,其基于训练数据集合的各元素的输入和关于所述训练数据集合的信息这两者中的至少一者,来生成用于使所述元素变形的扰动集合;
伪数据合成部,其根据所述训练数据集合和所述扰动集合,来生成与所述训练数据集合不同的新的伪数据集合;
评价部,其计算所述训练数据集合和所述伪数据集合的分布间距离或关于其的推算量,以及从所述扰动集合得到的伪数据相对于训练数据的扰动的大小;和
参数更新部,其更新所述扰动生成部生成所述扰动集合时所使用的参数,以使所述训练数据集合与所述伪数据集合的分布间距离相接近,使扰动的大小或期待值成为预定的目标值。
2.根据权利要求1所述的数据生成装置,其特征在于:
所述扰动生成部,除所述训练数据集合的各元素的输入或关于所述训练数据集合的信息之外,还基于所述训练数据集合的各元素的输出或关于该输出的信息,来生成所述扰动集合。
3.根据权利要求1所述的数据生成装置,其特征在于:
所述扰动生成部,除所述训练数据集合的各元素的输入或关于所述训练数据集合的信息之外,还基于与所述训练数据集合的输入相关的概率密度函数的推算量,来生成所述扰动集合。
4.根据权利要求1所述的数据生成装置,其特征在于:
所述扰动生成部,通过生成表示所述扰动集合的事后分布的参数分布的参量,来生成所述扰动集合。
5.根据权利要求1所述的数据生成装置,其特征在于:
生成可输入所述扰动生成部所使用的参数值或其范围的接口画面的显示数据。
6.根据权利要求1所述的数据生成装置,其特征在于:
生成表示了所述训练数据集合的各元素和所述伪数据集合的各元素的散点图的显示数据。
7.一种预测器学习装置,其特征在于,包括:
预测部,其根据所述训练数据集合中未包含的数据的输入,来预测输出;和
所述参数更新部,
所述预测部使用权利要求1~6中任一项所述的数据生成装置所生成的伪数据和所述训练数据,来进行学习。
8.根据权利要求7所述的预测器学习装置,其特征在于:
所述预测部由神经网络构成,
追加可以使输入所述训练数据时和输入所述伪数据时的内部状态之差,或者从所述训练数据生成的两个伪数据的内部状态之差变小的目...
【专利技术属性】
技术研发人员:但马庆行,河野洋平,
申请(专利权)人:株式会社日立制作所,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。