【技术实现步骤摘要】
【国外来华专利技术】支持复杂答案的证据搜索
本文描述的实施例涉及用于信息搜索的系统和方法。更具体地说,本文描述的实施例涉及处理搜索到的证据的查询结果。
技术实现思路
为问题的答案评分的方法之一包括在包含那些答案的段落中搜索证据并对这些证据评分。如果答案是单个具体实体,通常具有一个单词(例如,一个名称)或带有少量变体的短语,则此方法效果很好。例如,给定问题“纽约的首府是哪里?”答案“Albany”可以对包含“Albany”一词并支持所述问题答案的段落执行支持证据搜索,并且他们会计算所述段落回答所述问题的累计分数。但是,上述方法可能不适用于与可以用许多不同方式表达的更长、更复杂的答案相关的问题。例如,考虑到“为什么黄金价格昂贵”的问题,而候选者回答“因为它价高、美观并且在制作珠宝中非常有用”,那么期望一个数据集包含许多(如果有的话)文件其完全包含上面提供的完整答案是不现实的。为了解决这些和其他问题,本文描述的实施例提供了用于生成问题答案的系统和方法。在本文提供的系统和方法中,将答案中的术语设置为可选,以便支持证据搜索可以找到可能仅部分包含被 ...
【技术保护点】
1.一种生成问题答案的方法,所述方法包括:/n通过电子处理器接收具有多个疑问术语的问题;/n通过所述电子处理器识别所述问题的多个候选答案,其中所述多个候选答案中的每一个包括多个答案术语;/n对于所述多个候选答案中的每一个,搜索多个数据源以确定支持证据段落包括所述多个疑问术语中的一个或多个中的至少一个,以及包括在所述候选答案中的所述多个答案术语中的一个或多个;/n通过所述电子处理器,使用评分机制对所述多个候选答案中的每一个的每个所述支持证据段落进行评分,所述评分机制计算所述支持证据段落与所述多个疑问术语的第一相关程度,计算所述支持证据段落与所述多个候选答案中的一个的所述多个答 ...
【技术特征摘要】
【国外来华专利技术】20171215 US 15/844,2891.一种生成问题答案的方法,所述方法包括:
通过电子处理器接收具有多个疑问术语的问题;
通过所述电子处理器识别所述问题的多个候选答案,其中所述多个候选答案中的每一个包括多个答案术语;
对于所述多个候选答案中的每一个,搜索多个数据源以确定支持证据段落包括所述多个疑问术语中的一个或多个中的至少一个,以及包括在所述候选答案中的所述多个答案术语中的一个或多个;
通过所述电子处理器,使用评分机制对所述多个候选答案中的每一个的每个所述支持证据段落进行评分,所述评分机制计算所述支持证据段落与所述多个疑问术语的第一相关程度,计算所述支持证据段落与所述多个候选答案中的一个的所述多个答案术语的第二相关程度,并通过结合所述第一相关程度和所述第二相关程度来确定所述支持证据段落的分数;
通过所述电子处理器,基于与对所述多个候选答案中的每一个对每个所述支持证据段落进行所述评分相关联的所述分数,对所述问题的所述多个候选答案进行排名;以及
基于所述多个候选答案的排名来提供对所述问题的答案。
2.根据权利要求1所述的方法,还包括以下步骤:
使用所述问题和所述候选答案生成关键字搜索查询,其中将所述问题和所述候选答案中的所有所述术语标记为可选。
3.根据权利要求2所述的方法,还包括以下步骤:
使用一个或多个权重来确定所述第一相关度和第二相关度,所述一个或多个权重选自包括术语的词汇接近度、分布语义和统计模型组成的组。
4.根据权利要求3所述的方法,还包括以下步骤:
为每个所述支持证据段落遍历一组段落计分器;以及
对每个所述段落计分器确定所述支持证据段落回答所述问题以支持替代答案的程度进行评分,其中所述替代答案与所述候选答案匹配。
5.根据权利要求1所述的方法,还包括以下步骤:
计算所述多个疑问术语的第一匹配分数;
计算所述多个答案术语的第二匹配分数;以及
结合所述第一匹配分数和所述第二匹配分数。
6.根据权利要求2所述的方法,还包括以下步骤:
使用所述关键字搜索查询从数据语料库搜索所述多个支持证据段落。
7.根据权利要求6所述的方法,还包括以下步骤:
为每个所...
【专利技术属性】
技术研发人员:JW默多克,河银英,杭仲玮,K哈桑,N马坎戴亚,CM诺兰,潘林,SP佩迪,MD斯威夫特,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。