含意配对扩展装置、用于其的计算机程序以及提问应答系统制造方法及图纸

技术编号:16672837 阅读:41 留言:0更新日期:2017-11-30 17:18
本发明专利技术提供一种能够对现有的含意配对进行扩展并能够预测能够获得什么样的含意配对、并且还能够保证精度的含意关系配对扩展装置。含意配对扩展装置(50)从m项的含意配对生成n项的含意配对,从而对含意配对进行扩展。m以及n为0以上且m<n的整数。含意配对的每一个包含第一语言模式和第一语言模式蕴含的第二语言模式。含意配对扩展装置(50)包括:生成规则存储部(110),存储从m项的含意配对生成n项的含意配对的生成规则;和二元配对追加部(112),接受m项的含意配对,针对该m项的含意配对,对存储于生成规则存储部(110)的各生成规则判定其条件是否被m项的含意配对满足,若条件被满足,则对构成m项的含意配对的各语言模式应用生成规则的变形规则。

【技术实现步骤摘要】
【国外来华专利技术】含意配对扩展装置、用于其的计算机程序以及提问应答系统
本专利技术涉及自然语言处理,特别是,涉及高效地生成某个模式蕴含另一个模式那样的两个语言模式的配对的技术。
技术介绍
在提问应答系统中,例如,对于“是什么引起肺癌?”这样的提问,典型地,作为回答可得到“公害引起肺癌”这样的句子。这是因为,这两个句子共同具有“引起(肺癌)”这样的表现。但是,适合作为回答的句子并不限于像这样与提问具有共同的表现的句子。例如,可以想到“吸烟导致肺癌”这样的表现也是适合作为回答的句子。为了得到这样的回答,需要能够将“A引起B”用“A导致B”来换个说法的知识。在此,A以及B是变量,能够置换为任意的单词。在本说明书中,将像这样在多个表现中共同地出现的类型称为语言模式或简称为模式。更详细地,在本说明书中,由谓语和n个(n为0以上的整数)项的组合构成的表现称为n项语言模式。“A引起B”是由“引起”这样的谓语、和变量项A以及B所构成的两个项的组合构成的2项语言模式。在两个语言模式(模式配对)处于含意关系的情况下,在本说明书中将它们的模式配对称为含意模式配对(简称为“含意配对”)。在提问应答系统中,期望高精度地收集许多含意配对。作为用于获得含意配对的现有技术,存在后述的非专利文献1。非专利文献1所记载的技术通过如下方式来收集处于含意关系的模式配对。通过预先以人工方式收集处于含意关系的模式配对,从而构筑学习数据。针对该学习数据,将N-Gram、分布类似度等的分数作为特征量,进行在给出两个语言模式时判定一方是否蕴含另一方的判定器的机器学习。若判定器的学习结束,则从包括许多的句子的文集随机地生成大量的含意配对的候补。对这些候补的每一个进行基于判定器的判定。结果,通过收集被判断为处于含意关系的模式配对,从而能够收集学习数据中没有的新的含意配对。在先技术文献专利文献非专利文献1:JulienKloetzer、鸟泽健太郎、StijnDeSaeger、佐野大树、桥本力、后藤淳、含意关系模式配对的大规模获得、2013年度信息处理学会关西支部支部大会(2013年)
技术实现思路
专利技术要解决的课题通过现有技术,能够不经由人工地收集非常多的含意配对。但是,在使用基于机器学习的判定器的情况下,不能预测具体能够获得什么样的配对,也不能保证精度。因此,在开发提问应答系统时,存在必要的换言模式配对(含意配对)未被包罗的情况下的应对困难的问题。故此,本专利技术的目的在于,提供一种能够对现有的含意配对进行扩展并能够预测能够获得什么样的含意配对、并且还能够在某种程度上保证其精度那样的含意关系配对扩展装置。用于解决课题的技术方案本专利技术的第一方面涉及的含意配对扩展装置通过从m项的含意配对生成n项的含意配对,从而对含意配对进行扩展。其中,m以及n是0以上且满足m<n的整数。含意配对的每一个包含第一语言模式与第一语言模式蕴含的第二语言模式的配对。含意配对扩展装置包括用于存储用于从m项的含意配对生成n项的含意配对的生成规则的生成规则存储单元。该生成规则规定:为了应用该生成规则,m项的含意配对要满足的条件;以及包含在该条件得到满足时针对构成m项的含意配对的各个语言模式追加n-m个变量的语言模式的变形规则。含意配对扩展装置还包括:判定单元,其用于接受m项的含意配对,并针对该m项的含意配对,对存储在生成规则存储单元中的生成规则的每一个判定该生成规则的条件是否被m项的含意配对所满足;以及规则应用单元,其用于将由判定单元判定为条件得到满足的生成规则的变形规则应用于构成m项的含意配对的各语言模式,从而生成n项的含意配对。优选地,m为0,m项的含意配对分别是由谓语构成的谓语的含意配对。更优选地,n为1。含意配对扩展装置还可以包括:传递性应用单元,其用于通过对m项的含意配对应用传递性,从而对m项的含意配对进行扩展。优选为,含意配对扩展装置还包括:传递性应用单元,其用于通过对由规则应用单元生成的n项的含意配对应用传递性,从而对n项的含意配对进行扩展。本专利技术的第二方面涉及的计算机程序使计算机作为任一个含意配对扩展装置的全部单元而发挥功能。本专利技术的第三方面涉及的提问应答系统包括:含意配对存储单元,其用于对由上述的任一个含意配对扩展装置进行扩展得到的含意配对进行存储;文档存储单元,其存储有多个文档;模式提取单元,其用于接受提问,并通过对该提问进行句法分析,从而提取针对该提问的回答应具有的语言模式;模式扩展单元,其用于使用存储在含意配对存储单元中的含意配对对由模式提取单元提取出的语言模式的每一个进行扩展;检索单元,其用于从存储在文档存储单元中的文档检索与由模式扩展单元扩展得到的语言模式相匹配的表现,并计算出表示作为针对提问的回答的适合度的分数;以及选择单元,其用于在由检索单元检索的回答候补之中,优先在检索时相匹配的语言模式所包含的变量的数目最多的回答候补,使用分数来选择回答。附图说明图1是本专利技术的第一实施方式涉及的含意模式配对扩展装置的框图。图2是示出实现图1所示的一元配对生成部的程序的控制结构的流程图。图3是图1所示的一元配对扩展部的框图。图4是示出实现图3所示的一元配对扩展部中的传递性配对追加部的程序的控制结构的流程图。图5是示出实现图1所示的二元配对追加部的程序的控制结构的流程图。图6是示出图5所示的二元配对的生成处理的详情的流程图。图7是示出通过实验得到的一元配对全体的评价的曲线图。图8是示出通过实验得到的一元配对中的500个例子的评价的曲线图。图9是示出通过实验得到的二元含意配对中的500个例子的评价的曲线图。图10是示出本专利技术的第二实施方式涉及的提问应答系统的概略结构的功能框图。图11是实现本专利技术的第一实施方式涉及的含意模式扩展装置以及第二实施方式涉及的提问应答系统的计算机系统的外观图。图12是示出图11所示的计算机的内部结构的硬件框图。具体实施方式在以下的说明以及附图中,对于同一部件标注同一附图标记。因此,不再重复对他们的详细的说明。[用语的说明]在本说明书中,所谓“一元模式”,是指由一个变量和谓语构成的模式,在日语的情况下还包括连结它们的助词。上面举出的“引起A”、“导致A”等就是其例子。所谓“一元含意模式配对”,是指如下的两个一元模式,即,处于一方蕴含另一方那样的意思关系的两个一元模式。“引起A”和“导致A”这样的配对就是一个例子。也简称为“一元配对”。所谓“二元模式”,是指由两个变量和谓语构成的模式,在日语的情况下还包括连结它们的助词。“A引起B”、“A导致B”等就是其例子。所谓“二元含意模式配对”,是指如下的两个二元模式,即,处于一方蕴含另一方那样的意思关系的两个二元模式。由“A导致B”和“A引起B”构成的配对就是一个例子。也简称为“二元配对”。所谓“N元模式”,一般是指由N项变量、谓语、以及连结它们的助词构成的模式。所谓N元含意模式配对(称为“N元配对”),是指如下的N元模式的配对,即,一方蕴含另一方那样的N元模式的配对。[第一实施方式]<基本思想>第一实施方式从记述了动词之间的含意关系的现有的动词含意数据库(DB)生成一元配对。在这样得到的一元配对进一步追加从现有的一元模式DB生成的一元配对。通过大致以下的方法对得到的多个一元配对进一步进行扩展。详情在后面进行叙述。(本文档来自技高网
...
含意配对扩展装置、用于其的计算机程序以及提问应答系统

【技术保护点】
一种含意配对扩展装置,用于通过从m项的含意配对生成n项的含意配对,从而对含意配对进行扩展,其中,m以及n为0以上且满足m<n的整数,所述含意配对的每一个包含第一语言模式与所述第一语言模式蕴含的第二语言模式的配对,所述含意配对扩展装置包括:生成规则存储单元,其用于存储用于从所述m项的含意配对生成所述n项的含意配对的生成规则,该生成规则规定:为了应用该生成规则,所述m项的含意配对要满足的条件;以及在该条件得到满足时包含针对构成所述m项的含意配对的各个语言模式的n‑m个变量的追加的语言模式的变形规则;判定单元,其用于接受所述m项的含意配对,并针对该m项的含意配对,对存储在所述生成规则存储单元中的生成规则的每一个判定该生成规则的条件是否被所述m项的含意配对所满足;以及规则应用单元,其用于将由所述判定单元判定为所述条件得到满足的生成规则的所述变形规则应用于构成所述m项的含意配对的各语言模式,从而生成所述n项的含意配对。

【技术特征摘要】
【国外来华专利技术】2015.03.06 JP 2015-0444191.一种含意配对扩展装置,用于通过从m项的含意配对生成n项的含意配对,从而对含意配对进行扩展,其中,m以及n为0以上且满足m<n的整数,所述含意配对的每一个包含第一语言模式与所述第一语言模式蕴含的第二语言模式的配对,所述含意配对扩展装置包括:生成规则存储单元,其用于存储用于从所述m项的含意配对生成所述n项的含意配对的生成规则,该生成规则规定:为了应用该生成规则,所述m项的含意配对要满足的条件;以及在该条件得到满足时包含针对构成所述m项的含意配对的各个语言模式的n-m个变量的追加的语言模式的变形规则;判定单元,其用于接受所述m项的含意配对,并针对该m项的含意配对,对存储在所述生成规则存储单元中的生成规则的每一个判定该生成规则的条件是否被所述m项的含意配对所满足;以及规则应用单元,其用于将由所述判定单元判定为所述条件得到满足的生成规则的所述变形规则应用于构成所述m项的含意配对的各语言模式,从而生成所述n项的含意配对。2.根据权利要求1所述的含意配对扩展装置,其中,所述m为0,所述m项的含意配对分别是由谓语构成的...

【专利技术属性】
技术研发人员:川田拓也朱利安·克洛埃特泽鸟泽健太郎
申请(专利权)人:国立研究开发法人情报通信研究机构
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1