模型训练程序、模型训练方法以及信息处理装置制造方法及图纸

技术编号:36615852 阅读:17 留言:0更新日期:2023-02-15 00:22
本发明专利技术涉及模型训练程序、模型训练方法以及信息处理装置。信息处理装置选择判定模型的训练所使用的训练数据集所包含的多个训练数据中的能够由上述判定模型正确地判定的训练数据。信息处理装置向用户提示选择出的训练数据所包含的数据项目中的有助于判定的数据项目和判定结果。信息处理装置受理对提示的数据项目的解释的容易度的评价。信息处理装置以基于评价结果调整的损失函数为基础,使用训练数据集来执行判定模型的训练。据集来执行判定模型的训练。据集来执行判定模型的训练。

【技术实现步骤摘要】
【国外来华专利技术】模型训练程序、模型训练方法以及信息处理装置


[0001]本专利技术涉及模型训练程序、模型训练方法以及信息处理装置。

技术介绍

[0002]AI(Artificial Intelligence:人工智能)技术普及,不能够盲目地判断黑盒模型,希望显示出对人来说能够解释的判断的根据等可说明的机器学习模型的需要正在增加。据此,也进行预先使用规则列表、决策树、线形模型等白盒模型,但仅使用白盒模型,并不一定是对人来说能够解释的模型。
[0003]因此,近年来,进行通过重复进行模型生成与对人的反馈的对话型研究,生成人能够理解、精度较好的模型。例如,向用户显示“预测模型针对某输入的输出”任务,通过反应时间评价解释可能性。而且,按照评价,变更优化模型时的参数来更新模型。进行通过重复进行这样的处理来生成人能够理解且精度较好的模型。
[0004]非专利文献1:Isaac Lage,et al.,“Human-in-the-loop interpretability prior”,In proceedings of the 32nd International Conference on Neural Information Processing Systems(NIPS

18),pages 10180-10189,2018。
[0005]然而,上述技术以决策树、规则列表等人通过追踪分支能够预测输出的模型为对象,难以应用于线形模型。例如,在100个数据项目出现在当前模型中的情况下,用户浏览全部100个数据项目来概算模型的预测值对用户来说负担较大,是不现实的。
[0006]另外,由于线形模型的解释可能性由作为输出的说明而提示的数据项目的解释容易度决定,所以根据对上述任务的响应时间的长度无法评价解释可能性。

技术实现思路

[0007]在一个方面,其目的在于提供能够实现模型的容易解释的提高的模型训练程序、模型训练方法以及信息处理装置。
[0008]在第1方案中,模型训练程序使计算机执行如下的处理:选择判定模型的训练所使用的训练数据集所包含的多个训练数据中的能够由上述判定模型正确地判定的训练数据。模型训练程序使计算机执行如下的处理:向用户提示选择出的上述训练数据所包含的数据项目中的有助于判定的数据项目和判定结果,受理对提示的上述数据项目的解释的容易度的评价。模型训练程序使计算机执行如下的处理:以基于评价结果调整的损失函数为基础,使用上述训练数据集来执行上述判定模型的训练处理。
[0009]根据一实施方式,能够实现模型的解释的容易度的提高。
附图说明
[0010]图1是对实施例1所涉及的信息处理装置进行说明的图。
[0011]图2是对一般技术的问题点进行说明的图。
[0012]图3是表示实施例1所涉及的信息处理装置的功能构成的功能框图。
[0013]图4是对训练数据集的一个例子进行说明的图。
[0014]图5是对损失函数进行说明的图。
[0015]图6是对数据项目的推荐进行说明的图。
[0016]图7是对具体例的循环第一次进行说明的图。
[0017]图8是对查询画面例进行说明的图。
[0018]图9是对具体例的循环第二次进行说明的图。
[0019]图10是对具体例的循环第二次进行说明的图。
[0020]图11是对具体例的循环第三次进行说明的图。
[0021]图12是对具体例的循环第三次进行说明的图。
[0022]图13是对具体例的循环第四次进行说明的图。
[0023]图14是对具体例的循环第四次进行说明的图。
[0024]图15是对具体例的循环第五次进行说明的图。
[0025]图16是对具体例的循环第五次进行说明的图。
[0026]图17是表示处理的流程的流程图。
[0027]图18是对硬件构成例进行说明的图。
具体实施方式
[0028]以下,基于附图,详细地对本专利技术所涉及的模型训练程序、模型训练方法以及信息处理装置的实施例进行说明。此外,并不是通过该实施例限定该专利技术。另外,各实施例能够在没有矛盾的范围内适当地组合。
[0029]实施例1
[0030][信息处理装置的说明][0031]图1是对实施例1所涉及的信息处理装置10进行说明的图。图1所示的信息处理装置10是生成解释可能性较高的判定模型的计算机装置。该信息处理装置10通过与用户(人)的对话,重复进行人的评价的反馈和模型生成,生成尽量不让人费事、人能够理解且精度良好的模型。实施例1所涉及的信息处理装置10作为可说明的机器学习模型,以作为白盒模型的一个例子的线形模型为例进行说明。
[0032]此处,作为线形模型的一个例子,考虑基于对式(1)所示的损失函数进行最小化而获得的回归方程(参照式(2))的判定模型(学习模型)。此外,损失函数是包括训练数据、分类误差(判定误差)以及权重惩罚的目标函数的一个例子,回归方程示出数据项目假定为有d个的例子。回归方程是在m(x)>0时判定为正例,在此以外判定为负例的模型。
[0033][数1][0034][0035][数2][0036]回归方程m(x)=a1x1+a2x2+

+a
d
x
d

式(2)
[0037]一般而言,在训练而得的判定模型中,将与输入数据一致且权重不是“0”的数据项
目作为说明提示给用户。例如,在判定模型为m(x)=7x1-2x3-6x5时,输入了输入x=(0,1,1,0,1)的情况下,基于判定模型的预测值m(x)为“-8”。此时,由于x3和x5而判断为负例,特别是“x
5”能够作为重要而提示给用户。这样,若通过交互式的研究进行训练,则由于损失函数内的惩罚的调整,权重为“0”的数据项目增加,成为简洁的说明,但说明的简洁性和判定精度处于折衷的关系。
[0038]图2是对一般技术的问题点进行说明的图。如图2所示,如果增加数据项目则判定精度提高,但由于回归方程变长,用户“预测对某输入的模型的输出”的任务所涉及的时间变长。换句话说,判定用户是否能够解释各数据项目,获取到用户的评价为止的时间变长,判定模型的生成花费时间。另一方面,若缩短回归方程,则也会大多使用用户难以解释的数据项目x2、x5、x8(解释容易度=
×
)等,也不一定能够缩短用户对任务处理时间。
[0039]因此,实施例1所涉及的信息处理装置10为各数据项目准备模型生成时的惩罚系数,根据“评价所提示的数据项目”的任务的结果来更新惩罚系数。而且,信息处理装置10通过使用更新后的惩罚系数来执行模型的优化,从而执行损失函数的更新和模型的训练。
[0040]具体而言,信息处理装置10选择判定模型的训练所使用的训练数据集所包含的训练数据中的、能够由判定模型正确地判定的训练数据。而且,信息处理装置10向用户提示选择出的训练数据所包含的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种模型训练程序,其特征在于,使计算机执行如下的处理:选择判定模型的训练所使用的训练数据集所包含的多个训练数据中的能够由上述判定模型正确地判定的训练数据,向用户提示选择出的上述训练数据所包含的数据项目中的有助于判定的数据项目和判定结果,受理对提示的上述数据项目的解释的容易度的评价,以基于评价结果调整的损失函数为基础,使用上述训练数据集来执行上述判定模型的训练。2.根据权利要求1所述的模型训练程序,其特征在于,使上述计算机执行如下的处理:直到训练而得的上述判定模型满足用户要件为止,重复执行:向用户提示上述有助于判定的数据项目和判定结果、受理对上述数据项目的解释的容易度的评价、调整上述损失函数、以及训练与上述评价结果相应的上述判定模型,在训练而得的上述判定模型满足用户要件的情况下,输出训练而得的上述判定模型。3.根据权利要求2所述的模型训练程序,其特征在于,在进行上述选择的处理中,优先选择上述训练数据集所包含的上述多个训练数据中的如下训练数据,即:由上述判定模型做出的判定结果与标签一致,并且被作为评价对象提示给上述用户的数据项目的数量较少且基于上述判定结果的预测值的绝对值最大。4.根据权利要求2所述的模型训练程序,其特征在于,在上述提示的处理中,优先向上述用户提示选择出的上述训练数据所包含的数据项目中的如下数据项目,即:上述...

【专利技术属性】
技术研发人员:铃木浩史后藤启介
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1