判别模型学习设备、方法和程序技术

技术编号:9438154 阅读:142 留言:0更新日期:2013-12-12 17:52
为提供能有效地学习反映指示用于模型的用户的知识或分析意图的领域知识的判别模型,同时保持数据的拟合的判别模型学习设备。查询候选存储装置(81)将查询的候选存储为被给有指示用户的意图的领域知识的模型。正则化函数生成装置(82)基于被给予查询候选的领域知识,生成指示与领域知识的兼容性的正则化函数。模型学习装置(83)通过优化由损失函数定义的函数和为每一判别模型预定义的正则化函数,学习判别模型。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】为提供能有效地学习反映指示用于模型的用户的知识或分析意图的领域知识的判别模型,同时保持数据的拟合的判别模型学习设备。查询候选存储装置(81)将查询的候选存储为被给有指示用户的意图的领域知识的模型。正则化函数生成装置(82)基于被给予查询候选的领域知识,生成指示与领域知识的兼容性的正则化函数。模型学习装置(83)通过优化由损失函数定义的函数和为每一判别模型预定义的正则化函数,学习判别模型。【专利说明】判别模型学习设备、方法和程序
本专利技术涉及用于学习判别数据的判别模型的判别模型学习设备、判别模型学习方法和判别模型学习程序。
技术介绍
随着数据基础结构的最近快速发展,一个重要的工业目的是有效地处理大规模和大量数据。具体地,用于判别数据属于哪一类的技术是诸如数据挖掘和模式识别的许多应用中的主要技术之一。利用数据判别技术的一个示例是预测未分类的数据。例如,当进行车辆故障诊断时,对从车辆获得的传感器数据和过去故障情形进行学习,由此生成用于判别故障的规则。然后,将所生成的规则应用于其中发生新故障的车辆的传感器数据(即未分类数据),由此指定在车辆中发生的故障或缩窄(预测)其原因。数据判别技术还用于分析类别或因素间的差别。例如,当检验疾病和生活方式间的关系时,将待检验的群体分成有病的群体和无病的群体,以及仅学习用于判别两个群体的规则。例如,将由此学习的规则假定为“当目标者肥胖和吸烟,他/她具有疾病的高可能性”。在这种情况下,如果满足“肥胖”及“吸烟”两个条件,则怀疑它们是疾病的重要因素。对于有关数据判别的问题,最重要的目的是如何学习指示用于从目标数据分类数据的规则的判别模型。由此,提出了用于基于过去情形或模拟数据,从给有类别信息的数据学习判别模型的许多方法。这些方法是使用判别标签的学习方法,称为“监督学习”。类别信息可以被表示为下面中的判别标签。NPTLl中描述了示例性的监督学习,诸如逻辑回归、支持向量机和判决树。NPTL2中描述了半监督学习方法,其假定判别标签的分布并使用无判别标签的数据。NPTL2中描述了作为示例性半监督学习的拉普拉斯算子支持向量机。NPTL3中描述了称为用于考虑数据性质的变化来执行判别学习的协移或域自适应的技术。NPTL4中描述了学习判别模型所需的数据给出模型的估计的不确定性。引用列表非专利文献NPTLl: Christopher Bishop, “Pattern Recognition and MachineLearning,,, Springer, 2006NPTL2:MikhaiI Belkin, Partha Niyogi, Vikas Sindhwani, “ManifoldRegularization:A Geometric Framework for Learning from Labeled and UnlabeledExamples,,,Journal of Machine Learning Research(2006), Volume7, Issue48, p.2399-2434NPTL3:Hidetoshi Shimodaira, “Improving predictive inference undercovariate shift by weighting the log-likelihood function,,,Journal ofStatistical Planning and Inference, 90 (2),p.227-244,2000 年 10 月NPTL4:Burr Settles, “Active Learning Literature Survey,,,ComputerSciences Technical Reportl648, University of ffisconsin-Madison, 2010
技术实现思路
技术问题基于监督学习的判别学习具有下述问题。第一个问题是由于给有判别标签的数据量少,显著地恶化待学习的模型的性能。该问题由相对于模型参数的搜索空间的大小的少量数据引起,并且当不能很好地优化参数时会引起该问题。在基于监督学习的判别学习中,优化判别模型使得最小化由目标数据引起的判别误差。例如,对数似然函数用于逻辑回归,铰链损失函数用于支持向量机,以及信息增益函数用于判决树。然而,第二个问题是待学习的模型不一定与用户的知识匹配。通过其中将判别学习应用于车辆故障判别的情形来描述第二个问题。图12是示出用于学习判别模型的示例性方法的说明图。在该示例中,假定作为异常加热发动机的结果,发动机中出现故障,由此对于其旋转出现异常高频分量。在图12中,带圆的数据指示故障数据以及带叉的数据指示正常数据。在图12中所示的示例中,假定两个判别模型。一个是用于基于作为如由图12中所示的虚线91分类的故障原因的发动机温度进行判别的模型(判别模型1),以及另一个是用于基于作为如由图12中所示的虚线92分类的现象的发动机频率进行判别的模型(判别模型2)。判别模型2是基于发动机是否损坏,就优化而言,从图12中例示的判别模型I和判别模型2选择的。这是因为当选择判别模型2时,能完全分离开包括数据93的正常和异常数据的组。另一方面,当实际应用故障判别时,能相当精确地进行判别并且基于原因的判别模型I比基于现象的判别模型2更优选。第三个问题是通过数据自动优化的模型原则上不能捕获在数据中不存在的现象。下面将通过示例来描述第三个问题。在此假定从特定体检的检查数据来预测肥胖风险(一个人未来是否会变肥胖)。目前,在日本,有责任对年满40或更年长的人进行该特定体验,由此获得详细的检查数据。因此,可以通过使用该检查数据来学习判别模型。另一方面,可以使用判别模型来预防年轻人(诸如二十岁的人)的肥胖风险。然而,在这种情况下,在二十岁的人的数据与年满40或更年长的人的数据间,数据性质不同。因此,即使将四十岁的人的特性的判别模型应用于二十岁的人,也降低了判别结果的可靠性。为解决第一问题,考虑通过NPTL2中所述的半监督学习来学习模型。已知当有关判别标签的分布的假定正确时,半监督学习对第一问题也有效。然而,即使通过半监督学习,也不能解决第二个问题。在典型数据分析的情况下,执行用于先提取与类别有关的特征的特征提取或特征选择以便解决第二个问题。然而,当存在许多数据特征时,处理成本非常高的另一问题出现。此外,基于领域知识提取特征。然而,当所提取的特征与该数据不匹配时,导致判别准确度的大大降低。如NPTLl中所述,提出了许多基于机器的自动特征选择方法。最有代表性的自动特征选择方法是判别学习,诸如LI正则化支持向量机和LI正则化逻辑回归。然而,基于机器的自动特征选择方法选择用于优化标准的特征,由此不能解决第二个问题。NPTL3中所述的方法假定充分地获得包含在两组数据(在上述示例中,二十岁的人的数据和年满40或更年长的人的数据)中的数据并且两组数据的分布间的差别相对小。具体地,由于前者的限制,由NPTL3中所述的方法待学习的模型的应用被限制到事后分析两组充分收集的数据的应用。因此,本专利技术的一个示例性目的是提供一种判别模型学习设备、判别模型学习方法和判别模型学习程序,其能够有效地学习本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:森永聪藤卷辽平河原吉伸
申请(专利权)人:日本电气株式会社
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1