用于改善对输入问题的回答的方法和装置制造方法及图纸

技术编号:11572571 阅读:93 留言:0更新日期:2015-06-10 03:17
本发明专利技术的实施例涉及分析自然语言问题来确定缺失信息以便提高回答的准确性。提供了一种在数据处理系统中的用于改善对输入问题的回答的机制,该数据处理系统包括处理器和存储器,被配置为实现问答(QA)系统。输入问题被接收,并且针对回答该输入问题所需要的关键信息的已知集合而被解析。响应于一条或多条关键信息无法在输入问题中可识别,经由图形用户界面(GUI)针对该一条或多条关键信息提示提交了输入问题的用户。

【技术实现步骤摘要】

本申请一般地涉及改进的数据处理装置和方法,并且更具体地涉及用于分析自然 语言问题来确定缺失信息以便提高回答的准确性的机制。
技术介绍
随着诸如因特网的计算网络的越来越多的使用,人们目前被充斥和淹没在对其可 用的、来自各种结构化和非结构化源的信息量中。然而,当用户在搜索关于各种主题的信息 期间,尝试将他们发现的、他们认为相关的内容关联起来时,充满了信息差。为了辅助这样 的搜索,最近的研究已经指向生成问答(QA)系统,这可能需要输入问题、对其进行分析,并 且返回指示对输入问题的最适当回答的结果。QA系统提供用于通过例如电子文档的大的内 容源的集合来进行搜索的自动化机制,并且关于输入问题来对其进行分析,以确定对于该 问题的回答以及与一个回答对于回答输入问题的有怎样的准确度相关的置信度。 一种这样的QA系统是可从纽约的阿芒克的国际商业机器(IBM)公司提供的 Watson?系统。Watson?系统是商级自然语目处理、/[目息检索、知识表不和推理和机器学习 技术对开放域问体回答领域的应用。Watson?系统是建立在用于假设生成、大量证据收集、 分析和评分的IBM的DeepQA?技术之上。DeepQA?纳入输入问题,对其进行分析,将问题分 解为组成部分,基于分解的问题和回答源的主要搜索的结果来生成一个或多个假设,基于 来自证据源中的证据的检索来执行假设和证据评分,执行一个或多个假设的合成,并且基 于训练的模型来执行最后的合并和排序,以输出对输入问题的回答以及置信度。
技术实现思路
在一个说明性实施例中,提供了一种在数据处理系统中的用于改善对输入问题的 回答的方法,该数据处理系统包括处理器和存储器,被配置为实现问答(QA)系统。该说明 性实施例接收输入问题,并且针对回答该输入问题所需要的关键信息的已知集合来解析该 输入问题。该说明性实施例响应于一条或多条关键信息在输入问题中无法是可识别的,来 经由图形用户界面(GUI)针对该一条或多条关键信息提示提交了输入问题的用户。 在其他说明性实施例中,提供了 一种计算机程序产品,包括具有计算机可读程序 的计算机可用或可读介质。该计算机可读程序在计算设备上执行时,使得计算设备执行以 上关于方法说明性实施例列出的操作的各种操作和组合。 在另一说明性实施例中,提供了一种系统/装置。该系统/装置可以包括一个或 多个处理器以及耦合到一个或多个处理器的存储器。该存储器可以包括指令,当由一个或 多个处理器执行时,使得一个或多个处理器执行以上关于方法说明性实施例所列出的操作 的各种操作和组合。 在以下本专利技术的示例性实施例的具体描述中描述了本专利技术的这些和其他特征和 优点,并且对于本领域普通技术人员来说说显而易见的。【附图说明】 当结合附图阅读时,通过参考以下说明性实施例的具体描述,将最好地理解本发 明及其使用的优选模式以及其他目标和优点,其中: 图1是可以实现说明性实施例的回答系统的各方面的分布式数据处理系统的示 意图; 图2是可以实现说明性实施例的各方面的计算设备的示例性框图; 图3图示了根据一个说明性实施例的用于处理输入问题的QA系统管道; 图4是图示根据一个说明性实施例的图形用户界面引擎的示例框图的示例图;以 及 图5是概述根据一个说明性实施例的用于生成用于利用问答系统的用户协作的 图形用户界面(GUI)的示例性操作的流程图。【具体实施方式】 问答(QA)系统,诸如IBM的WatS〇n?QA系统,需要大量计算能力来分析自然语言 问题,并且从候选发现确定结果。此外,在诸如IBM的Wats 〇n?QA系统的问答系统中,对于 任何知识域、语料库,如果所有已知和相关的数据作为问题的一部分被输入或者作为关于 该问题的输入的集合提供,则可以用更确切的回答来响应很多问题。例如,在医疗知识域 中,在处理输入之前没有获取的缺失的诊断数据、模糊的注释、关键患者信息等可以使得以 低置信度返回回答。当前,除了用"难道你的意思是?"来对问题进行响应以涵盖拼写错误 或对所需字段的典型形式验证,不存在用于关于处理非结构化数据的自然语言系统中的问 题是否提供所有相关信息的当前手段。出于说明性实施例的目的,术语"问题"是指问题以 及与应当可用作输入的给定问题相关联的"数据和信息的集合"。因此,该说明性实施例支 持对自然语言问题进行分析以确定缺失信息,以便提高回答的准确性。 通过示例性实施例的机制,当用户将问题输入到问答系统时,自然语言处理确定 考虑中的和/或与输入相关联的关键信息是否缺失,或者包括模糊的术语。如果自然语言 处理确定了问题中的信息缺失或模糊,则说明性实施例在不提供对问题的回答的情况下, 返回对特定缺失信息的请求。然而,如果提供了所有的关键信息,但是将改善回答的其他必 要信息缺失或模糊,则说明性实施例用回答但是以较低的置信度来进行响应。即,说明性 实施例的QA系统认识到,只有通过具有全部或大部分的必要信息,才可以提供更明确的回 答。如果一些基本但不关键的信息缺失或模糊,则说明性实施例提供一个或多个回答,但是 还指示缺失或模糊的其他信息,这在被提供或澄清时将改善回答。 更具体地,在QA系统中的问题处理期间,QA系统首先确定所有的关键信息是否已 经在问题中或与问题相关联的信息中被直接提供。例如,考虑下述问题:"对具有症状S1、 S2和S3的患者进行什么诊断? "。QA系统解析问题,并且关于所需要的关键信息是否提供 了所有特定注解。即,关于所呈现的上述问题以及由特定QA系统管理员和/或训练器识别 的关键信息,说明性实施例将快速确定缺失的关键信息,诸如患者性别、患者年龄、患者当 前历史、患者家族史、当前药物和剂量、血液测试结果等。然而,QA系统还能够向自己学习。 艮P,如果在医生、护士、专家等在患者的电子文件中时询问上述示例性问题,那么QA系统将 认识到,正在向当前患者询问该问题,并且解析与该患者相关联的信息来确定关键信息。因 此,说明性实施例的QA系统时常能够以直接的方式来识别缺失的信息。即,QA系统可以容 易地能够识别特定属性,并且因此,容易识别那些缺失的关键属性。更复杂的短语和条件提 供了对什么信息是以及什么不是信息并且因此什么信息缺失的更大的挑战和不太清楚的 界限。 此外,如果关键信息被提供,但是该信息在某种程度上是模糊的,则QA系统 可以请求澄清。例如,如果当前药物和剂量信息指示"试过多种抗生素"、"服用了一阵 Augmentin⑧"或"z-pack等",则这些短语中的每一个都包括模糊的信息。即,术语"多 种"、"一会儿"和"其他"是指什么。因此,说明性实施支持对澄清问题的响应,诸如"请说 明所服用的抗生素的名字"、"请提供服用Augmentin?的准确剂量"或"请列出所服用的 其他药物"。 -旦提供了所有的关键信息,该说明性实施例就分析问题中提供的信息以及与患 者相关联的所有信息作为用于确定在问题中的信息与所有已知的疾病、疾患、状况等之间 的相似度,这在下文中被统称为疾病。即,QA系统可以进行在所提供的症状S1、S2和S3与 所有已知的疾病之间的初始相关,以识别疾病的子集。一旦识别了疾病的该子集,该QA系 统就开始以进一步通过消除不在与患者相关联的信息内的所有项来进一步细化疾本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/CN104699741.html" title="用于改善对输入问题的回答的方法和装置原文来自X技术">用于改善对输入问题的回答的方法和装置</a>

【技术保护点】
一种在数据处理系统中的用于改善对输入问题的回答的方法,所述数据处理系统包括处理器和存储器,被配置为实现问答系统(QA),所述方法包括:在所述数据处理系统中接收所述输入问题;由所述数据处理系统针对回答所述输入问题所需要的关键信息的已知集合来解析所述输入问题;以及响应于一条或多条关键信息无法在所述输入问题中可识别,经由图形用户界面(GUI)针对所述一条或多条关键信息提示提交了所述输入问题的用户。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:P·F·哈格D·A·约翰逊M·G·梅格里安J·E·皮特里S·J·罗尔达L·R·斯马策R·J·史蒂文斯R·L·史迪威
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1