【技术实现步骤摘要】
【国外来华专利技术】非事实型询问应答系统以及方法
本专利技术涉及询问应答系统,尤其涉及针对询问某事的理由等的所谓的how型、why型询问等被称为非事实询问的询问的应答系统。
技术介绍
与针对一些事实的询问应答(QA)相关的研究最近取得了大的进展。例如美国的竞猜节目中这种系统战胜人类的情况记忆犹新。针对与事实相关的询问,其精度据说为85%程度。即便在这样的与事实相关的询问应答系统以外的领域,同样地关于针对精度高的询问应答系统的研究,其必要性也开始被认可。然而,关于并非与事实相关的询问,例如与“为何”相关的询问,以及与“如何”相关的询问,实情是研究还未取得进展。作为这样的系统的例子,有在后述的非专利文献1中记载的系统。在该系统中,对询问和语料库内的各句进行词素解析,进而使用其结果来计算利用了从询问中所得到的单词的文档频度、各句中的单词频度、文档总数、文档的长度等的得分,并从语料库中选择得分上位的给定个数的文档。将在选择出的文档中所含的段落、以及1~3个连续的段落作为回答候选,主要通过询问中的单词与回答候选中所含的单词之间所计算的得分,来选择针对询问的回答。然而,如后述可知,在该系统中得不到足够的性能。为此,作为对该系统进一步改良后的系统,能考虑后述的非专利文献2中所记载的那样的系统。该系统例如在通过非专利文献1所记载的技术而选择了几个回答候选后,进而通过给定的得分来对各回答候选进行重新排序。以下,基于非专利文献2的记载来说明被认为是典型的实现该系统时的实现例。此外,以下将关于并非与事实相关的询问称为“非事实型询问”。参照图1,该询问应答系统30例如将在互联网上能检索的非常多的句子 ...
【技术保护点】
一种非事实型询问应答系统,接受非事实型询问的输入并生成针对该询问的回答,所述非事实型询问应答系统与用于对由处理对象的语言的文档亦即计算机可读取的文档组成的语料库进行存储的语料库存储单元相连接而被使用,所述非事实型询问应答系统包含:候选检索单元,其用于响应于已接受询问的输入的情况,从所述语料库存储单元之中检索并取出针对该询问的多个回答候选;特征生成单元,其用于响应于已接受询问的输入的情况,针对该询问与存储在所述候选检索单元中的各个回答候选的组合,来生成给定的特征的集合;得分计算单元,其预先进行了学习,使得:在被给出由所述特征生成单元生成的所述特征的集合时,针对成为生成该特征的集合的基础的询问以及回答候选的组合,来计算表示该回答候选是针对该询问的正确回答的程度的得分;以及回答选择单元,其针对所述询问与存储在所述回答候选中的各个回答候选的组合,基于由所述得分计算单元计算出的得分,将针对所述询问为正确回答的可能性最高的回答候选作为针对所述询问的回答进行输出,针对由所述候选检索单元检索出的各个回答候选,赋予了由所述特征生成单元生成特征所需的信息,所述特征生成单元,包含:句法解析单元,其用于针对所 ...
【技术特征摘要】
【国外来华专利技术】2012.02.23 JP 2012-0369721.一种非事实型询问应答系统,接受非事实型询问的输入并生成针对该询问的回答,所述非事实型询问应答系统与用于对由处理对象的语言的文档亦即计算机可读取的文档组成的语料库进行存储的语料库存储单元相连接而被使用,所述非事实型询问应答系统包含:候选检索单元,其用于响应于已接受询问的输入的情况,从所述语料库存储单元之中检索并取出针对该询问的多个回答候选;特征生成单元,其用于响应于已接受询问的输入的情况,针对该询问与由所述候选检索单元取出的各个回答候选的组合,来生成给定的特征的集合;得分计算单元,其预先进行了学习,使得:在被给出由所述特征生成单元生成的所述特征的集合时,针对成为生成该特征的集合的基础的询问以及回答候选的组合,来计算表示该回答候选是针对该询问的正确回答的程度的得分;以及回答选择单元,其针对所述询问与由所述候选检索单元取出的各个回答候选的组合,基于由所述得分计算单元计算出的得分,将针对所述询问为正确回答的可能性最高的回答候选作为针对所述询问的回答进行输出,针对由所述候选检索单元检索出的各个回答候选,赋予了由所述特征生成单元生成特征所需的信息,所述特征生成单元,包含:句法解析单元,其用于针对所述询问进行词素解析以及句法解析,并输出词素信息以及语法信息;以及评价单元,其用于从所述询问当中确定遵照某评价基准而被分类为第1评价类的词组以及被分类为第2评价类的词组,针对所述第1评价类以及第2评价类各自分配了彼此相反的评价的极性,所述询问应答系统还包含:特征集合生成单元,其用于针对所述询问与各个所述回答候选的组合,基于所述句法解析单元的解析结果、由所述评价单元确定出的词组的位置及其评价类的极性、以及对所述回答候选所赋予的特征生成用信息,来生成所述特征的集合。2.根据权利要求1所述的非事实型询问应答系统,其中,所述特征生成单元还包含:含义类变换单元,其用于将包含在所述句法解析单元的输出中的各名词分类成预先准备的多个单词的含义类中的任一者,并将该名词变换成对应的含义类,所述特征集合生成单元包含:第1单元,其用于针对所述询问与各个所述回答候选的组合,基于所述句法解析单元的解析结果、由所述评价单元确定出的词组的位置及其评价类的极性、由所述含义类变换单元被进行了变换后的所述句法解析单元的输出、以及对所述回答候选所赋予的特征生成用信息,来生成所述特征的集合。3.根据权利要求2所述的非事实型询问应答系统,其中,所述第1单元基于由所述评价单元确定出的词组的位置以及评价...
【专利技术属性】
技术研发人员:吴钟勋,鸟泽健太郎,桥本力,川田拓也,史蒂恩·德萨哲,风间淳一,王轶讴,
申请(专利权)人:独立行政法人情报通信研究机构,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。