课题在于,提供选择学习模型的系统及选择学习模型的方法,从训练完成的学习模型中选择利用于新任务的适合的学习模型。解决手段在于,存储装置存放多个现有学习模型各自的关联信息。处理器取得关于新任务的内容的信息,从用于新任务的新训练数据集提取新特征量矢量。处理器参照关联信息,取得关于多个现有模型各自的任务的内容的信息、以及多个现有模型各自的训练数据的特征量矢量。处理器基于关于新任务的内容的信息与关于多个现有模型各自的任务的信息之间的比较结果、以及新特征量矢量与多个现有模型各自的特征量矢量之间的比较结果,从多个现有模型选择用于新任务的候选学习模型。模型。模型。
【技术实现步骤摘要】
选择学习模型的系统及选择学习模型的方法
[0001]本专利技术涉及选择学习模型的系统。
技术介绍
[0002]对进行“长尾业务活动”(虽然有大量顾客,但关于各顾客只能利用极少的数据的业务活动)的企业而言,将以前开发的深度学习模型用于新的顾客是有益的。例如,专利文献1公开生成深度学习网络模型的方法。该方法从用户的多模式输入中提取与深度学习网络的生成相关联的1个以上的项目,基于该项目对源于深度学习网络模型的详情进行估计。该方法制作基于深度学习网络模型的中间表现,该中间表现包含与深度学习网络模型相关联的1个以上的数据项目、以及源于深度学习网络模型的1个以上的设计详情。该方法将中间表现自动地转换为源码。
[0003]在先技术文献
[0004]专利文献
[0005]专利文献1:美国专利申请公开第2018/0307978号
技术实现思路
[0006]专利技术所要解决的课题
[0007]但是,基于以下几个理由,难以将以前开发的深度学习模型用于新的顾客。这些理由有顾客的数据集间的域间隙(domain gap)、深度学习框架的差异、任务的差异等。进而,难以对一个顾客的数据集进行评价,并利用追加数据进行补充。因此,此前的途径是充分收集新的顾客的数据,或者利用极少量的数据从最初开始构筑新的模型。前者存在学习的实施相应地延迟的问题,后者存在性能有可能无法达到充分好的问题。另外,在使用以前构筑的模型的情况下,为了理解其安装需要付出很大努力。
[0008]用于解决课题的手段
[0009]本专利技术的一个方式是选择针对用户任务的学习模型的系统,包含1个以上的处理器和1个以上的存储装置,所述1个以上的存储装置存放多个现有学习模型各自的关联信息,所述1个以上的处理器取得关于新任务的内容的信息,从用于所述新任务的新训练数据集提取新特征量矢量,参照所述关联信息,取得关于所述多个现有模型各自的任务的内容的信息、以及所述多个现有模型各自的训练数据的特征量矢量,基于关于所述新任务的内容的信息与关于所述多个现有模型各自的任务的信息之间的比较结果、以及所述新特征量矢量与所述多个现有模型各自的特征量矢量之间的比较结果,从所述多个现有模型选择用于所述新任务的候选学习模型。
[0010]专利技术效果
[0011]根据本专利技术的一个方式,能够从训练完成的学习模型中选择利用于新任务的恰当的学习模型。
附图说明
[0012]图1A示意性地表示本说明书的一个实施方式所涉及的模型生成系统的逻辑构成。
[0013]图1B表示本说明书的一个实施方式所涉及的模型生成系统的硬件构成例。
[0014]图2表示本说明书的一个实施方式所涉及的模型生成系统的整体动作例。
[0015]图3表示本说明书的一个实施方式所涉及的任务分析部、本质特征量提取部、数据库比较部以及模型选择部的处理例。
[0016]图4表示本说明书的一个实施方式所涉及的数据集评价部的处理例。
[0017]图5表示本说明书的一个实施方式所涉及的模型数据库中存放的数据的构成例。
[0018]图6示意性地表示用于学习模型选择的用户界面、以及用于该用户界面的数据的模型生成系统的处理的例子。
[0019]图7示意性地表示用于向用户数据集追加新的数据的用户界面图像的例子。
[0020]图8示意性地表示本说明书的一个实施方式所涉及的初始化阶段。
[0021]附图标记说明:
[0022]10 模型生成系统
[0023]101 用户界面
[0024]102 任务分析部
[0025]103 本质特征量提取部
[0026]104 数据库比较部
[0027]105 模型选择部
[0028]106 数据集评价部
[0029]107 模型训练部
[0030]108 模型数据库
[0031]151 处理器
[0032]152 存储器
[0033]153 通信装置
[0034]154 辅助存储装置
[0035]155 输入装置
[0036]156 输出装置
[0037]181 用户任务描述
[0038]182 用户数据集
[0039]301 用户固有特征量矢量
[0040]302、303 本质特征量矢量
[0041]802、803、804 特征量矢量
具体实施方式
[0042]以下,在为了方便而需要的情况下,分为多个部分或者实施例进行说明,但除了特别明示的情况之外,它们并不是相互无关的,其关系为一方成为另一方的一部分或者全部变形例、详细说明、补充说明等。另外,以下,在言及要素的数量等(包含个数、数值、量、范围等)的情况下,除了特别明示的情况以及在原理上显然限定于特定的数量的情况等之外,不
限定于该特定的数量,是特定的数量以上或以下皆可。
[0043]本系统既可以是物理性的计算机系统(一个以上的物理性的计算机),也可以是在基于云的计算资源群(多个计算资源)上构筑的系统。计算机系统或者计算资源群包含1个以上的接口装置(例如包含通信装置及输入输出装置)、1个以上的存储装置(例如包含存储器(主存储)及辅助存储装置)、以及1个以上的处理器。
[0044]在程序由处理器执行从而实现功能的情况下,适宜地使用存储装置及/或者接口装置等并且进行规定的处理,因此功能也可以被作为处理器的至少一部分。以功能作为主语说明的处理,也可以作为处理器或者具有该处理器的系统所进行的处理。程序也可以从程序源安装。程序源例如也可以是程序分发计算机或者计算机可读取的存储介质(例如计算机可读取的非易失性存储介质)。各功能的说明是一例,既可以将多个功能汇总为一个功能,或者也可以将一个功能分割为多个功能。
[0045]以下提出的系统通过基于数据库及用户希望执行的任务的描述,自动地选择恰当的模型,从而使得易于使用以前构筑的学习模型。现有的学习模型的类型是任意的,例如是深度学习模型。以下,也将学习模型简称为模型。
[0046][概略][0047]在一个实施方式中,用户将自己希望执行的任务(新任务)的简单的描述与该任务的训练数据集一起向系统输入。系统从训练数据集提取本质特征量,从任务的描述提取其关联信息。系统在存放着模型以及其训练所使用的数据、对应的本质特征量及对应任务的描述的数据库中,使用这些信息找出有关联的学习模型。从数据库选择的学习模型被使用用户的数据集进行微调整(再训练)。由此,能够使模型适于不同的用户数据集。
[0048]在其他方式中,在上述构成的基础上,还对用户的训练数据集进行评价,运算对模型有害的样本在训练数据集中的比例。有害样本是对学习模型的训练有害的样本,例如是由于错误附加标签或收集低品质数据引起的偏离值。基于训练数据集中的有害样本的比例,系统能够利用从现有数据库、互联网等取得的新的数据来补充用户的训练数据集。由此,能够提高用于用户的学习模型的性能。
...
【技术保护点】
【技术特征摘要】
1.一种选择针对用户任务的学习模型的系统,包含:1个以上的处理器;以及1个以上的存储装置,所述1个以上的存储装置存放多个现有学习模型各自的关联信息,所述1个以上的处理器进行:取得关于新任务的内容的信息,从用于所述新任务的新训练数据集提取新特征量矢量,参照所述关联信息,取得关于所述多个现有学习模型各自的任务的内容的信息、以及所述多个现有学习模型各自的训练数据的特征量矢量,基于关于所述新任务的内容的信息与关于所述多个现有学习模型各自的任务的信息之间的比较结果、以及所述新特征量矢量与所述多个现有学习模型各自的特征量矢量之间的比较结果,从所述多个现有学习模型选择用于所述新任务的候选学习模型。2.如权利要求1所述的系统,所述1个以上的处理器判定所述新训练数据集中包含的样本在所述候选学习模型的训练中是否有害。3.如权利要求2所述的系统,在被判定为有害的样本的量为阈值以上的情况下,所述1个以上的处理器决定向所述新训练数据集追加新的样本。4.如权利要求3所述的系统,所述1个以上的处理器基于关于所述新任务的信息,检索向所述新训练数据集追加的新的样本,所述1个以上的处理器判定所述新的样本在所述候选学习模型的训练中是否有害。5.如权利要求1所述的系统,所述1个以上的处理器进行:从所述新训练数据集生成多个特征量矢量,基于所述多个特征量矢量与所述多个现有学习模型各自的特征量矢量之间的比较结果,从所述多个特征量矢量决定所述新特征量矢量。6.如权利要求1所述的系统,所述1个以上的处理器使用所述新训练数据集来训练所述候选学习模型。7.如权利要求6所述的系统,所述1个以上的处理器将所述新...
【专利技术属性】
技术研发人员:C,
申请(专利权)人:株式会社日立制作所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。