计算机生成的在问答系统中的自然语言输出技术方案

技术编号:14057899 阅读:120 留言:0更新日期:2016-11-27 10:04
提供了用于生成自然语言输出的方法、计算机系统以及计算机存储介质。三元组的集合可以被用来将语音询问和回答映射为句子结构,所述句子结构能够被用作对于所述语音询问的输出回答。句子结构仅对于特定的三元组的集合是适合的。一个或多个约束可以与所述三元组的集合相关联,以确保句子结构仅在正确情形下应用。为了成为有效的句子结构,与其相关联的每个约束必须被满足。如果每个约束被满足,则句子结构是有效的,且可以被用作输出回答的格式。如果没有满足每个约束,则可以评估与所述三元组的集合相关联的另外的句子结构,直到识别出有效的句子结构。如果没有句子结构是有效的,则没有输出被生成。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
自然语言生成通常是利用来自知识库的三元组的集合(set of triples)来执行的。三元组(triple)被编译成有效的自然语言句子。越来越常见的是,用户想要的是响应于他们口头提交给设备的询问而输出的自然语言句子。时常地,响应于自然表达的口头询问,所返回的自然语言句子回答是不正确的或是像机器人的且听起来不自然。
技术实现思路
提供该“
技术实现思路
”是为了引入将在后文“具体实施方式”中进一步描述的简化形式的概念的选集。该“
技术实现思路
”并不意图识别所要求保护的主题的关键特征或必要特征,并且也不意图用于帮助确定所要求保护主题的范围。本专利技术的实施例涉及用于生成自然语言输出的系统、方法和计算机存储介质以及其他。如所提及的,本专利技术寻求生成既正确(或有效)又听起来自然的自然语言输出,其中所述输出是在说出时通顺(flow well)的句子。知识库三元组可以被用于将询问表达成机器可读语言,所述机器可读语言能够被转换成自然语言输出。三元组可以与适合被用于特定三元组的一个或多个句子结构相关联。如本文中所使用的“句子结构”一般指的是示例性的上下文无关(context free)句子格式,其包括可以被替代的一个或多个变量。三元组和/或句子结构还可以与一个或多个约束相关联。如本文所使用的“约束”一般指的是一种规则,其对能够被用于替代变量的值的类型进行限制。当与句子结构相关联的约束被满足时,该句子结构可以被用作输出回答,如后文详细描述的。因此,在一个实施例中,本专利技术涉及一个或多个计算机存储介质,其上具体实现有计算机可执行指令,所述指令当被一个或多个计算设备执行时实现生成自然语言输出的方法。所述方法包括:从用户处接收询问;识别对询问的回答;将回答映射为来自知识库的结构化数据;识别与结构化数据相关联的句子结构;识别与句子结构相关联的一个或多个约束被满足;以及当一个或多个约束中的每个被满足时,将输出回答以句子的形式传达给询问。在另一实施例中,本专利技术涉及一种用于生成自然语言输出的计算机系统。所述系统包括:计算设备,其与具有一个或多个处理器和一个或多个计算机存储介质的自然语言引擎相关联;以及与自然语言引擎耦合的数据存贮,其中自然语言引擎识别对询问的回答,将回答映射为来自知识库的结构化数据,识别与结构化数据相关联的句子结构,识别与句子结构相关联的一个或多个约束,以及将输出回答以句子的形式传达给询问。在另一实施例中,本专利技术涉及一种用于生成自然语言输出的计算机化方法。所述方法包括:从用户处接收询问;识别对语音输入询问的回答;将回答映射为三元组的集合;识别与三元组的集合相关联的至少一个规则,其中至少一个规则包括与所述三元组的集合相关联的上下文无关语法句子结构以及与上下文无关语法句子结构相关联的至少一个约束;确定至少一个约束是否被满足;以及当确定与上下文无关语法句子结构相关联的至少一个约束被满足时,将语音输出回答以句子的形式传达给语音输入询问。附图说明以下结合附图详细描述了本专利技术,其中:图1是适于用于实现本专利技术的实施例的示例性计算环境的框图;图2是适于用于实现本专利技术的实施例的生成自然语言输出的示例性系统的框图;图3是根据本专利技术的实施例的用于生成自然语言输出的示例性方法的流程图;图4是根据本专利技术的实施例的生成自然语言输出的示例性方法的流程图;以及图5是根据本专利技术的实施例的生成自然语言输出的示例性方法的流程图。具体实施方式本专利技术的主题是关于其特殊性描述的,以满足法定要求。然而,说明书本身并非旨在限制该专利的范围。相反地,专利技术人考虑到了所要求保护的主题还可能结合其它当前的或将来的技术以其它方式实现,以包括与在本文献中描述的步骤相似的不同步骤或步骤组合。此外,虽然术语“步骤”和/或“框(block)”在此可以用于表示方法所采用的不同元素,但是所述术语不应该被解释为暗示了在本文公开的各种步骤之间的任何特定的次序,除非各个步骤的次序被明确描述。本文描述的技术的各个方面一般涉及生成自然语言输出的系统、方法和计算机存储介质等。本专利技术涉及生成既正确(或有效)又听起来自然的自然语言输出,其中所述输出是在说出时通顺的句子。知识库三元组可以被用于将询问表达成机器可读语言。三元组可以与适用于特定三元组的句子结构相关联。本文所使用的“句子结构”一般指的是示例性的上下文无关句子格式,其包括能够被替代的一个或多个变量。三元组和/或句子结构还可以与一个或多个约束相关联。如本文所使用的“约束”一般指的是一种规则,其对能够替代变量的值的类型进行限制。当与句子结构相关联的约束被满足时,该句子结构可以被用作输出回答。在已经简略描述了本专利技术的实施例的概况后,在下文描述可以实现本专利技术的实施例的示例性操作环境,以便提供用于本专利技术的各个方面的一般上下文。在总体上参考附图,并且最初特别参考图1,示出用于实现本专利技术的实施例的示例性操作环境,其一般地被指定为计算设备100。计算设备100是且仅是适当的计算环境的一个例子,并不意图暗示对本专利技术的实施例的用途或功能的范围的任何限制。计算设备100也不应被解释为对关于图示组件的任一或其组合具有任何依赖或要求。本专利技术的实施例可以在计算机代码或机器可用指令的一般上下文中描述,计算机代码或机器可用指令包括计算机可用或计算机可执行指令(例如程序模块),其由计算机或其它机器(例如,个人数字助理、智能电话、平板PC或其它手持设备)执行。一般而言,包括例程、程序、对象、组件、数据结构等的程序模块指的是执行特定任务或实现特定抽象数据类型的代码。本专利技术的实施例可以以多种系统配置实践,包括手持设备、消费电子产品、通用计算机、更专业的计算设备等。本专利技术的实施例还可以实践于分布式计算环境中,其中任务是通过经由通信网络链接的远程处理设备执行的。在分布式计算环境中,程序模块可以位于本地和远程计算机存储介质(包括存储器存储设备)中。继续参考图1,计算设备100包括总线110,其直接或间接耦合以下设备:存储器112、一个或多个处理器114、一个或多个呈现组件116、一个或多个输入/输出(I/O)端口118、一个或多个I/O组件120以及示例性的电源122。总线110表示的可能是一条或多条总线(例如,地址总线、数据总线或其组合)。虽然为了清楚起见用线条示出了图1的各种框,但是在现实中,这些框表示逻辑的而不一定是实际的组件。例如,人们可以将呈现组件(例如显示设备)认为是I/O组件。并且,处理器具有存储器。本专利技术人认识到这是本领域的特性,并且重申图1的图仅是说明可以结合本专利技术的一个或多个实施例使用的示例性计算设备。在例如“工作站”、“服务器”、“膝上型计算机”、“手持设备”等这样的种类之间并不进行区分,因为所有这些都被认为在图1的范围内且被称作“计算设备”。计算设备100通常包括多种计算机可读介质。计算机可读介质可以是计算设备100可访问的任意可用介质,并且包括易失性和非易失性介质、可移除和不可移除介质。计算机可读介质包括计算机存储介质和通信介质;计算机存储介质本身不包括信号。计算机存储介质包括用任意方法或技术实现的用于存储信息(例如,计算机可读指令、数据结构、程序模块或其它数据)的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于:RAM、ROM、EEP本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201580015901.html" title="计算机生成的在问答系统中的自然语言输出原文来自X技术">计算机生成的在问答系统中的自然语言输出</a>

【技术保护点】
一种在服务器上用于构造自然语言输出的方法,所述方法包括:从用户处接收语音输入询问;识别响应于所述语音输入询问的回答;将所述回答映射为来自被布置为存储结构化数据的知识库的所述结构化数据,其中,映射将所述回答转变为由自然语言引擎使用的机器能够读取的语言;识别与所述回答被映射为的所述结构化数据相关联的句子结构;将所述回答被映射为的所述结构化数据布置到所述句子结构中;识别与所述句子结构相关联的一个或多个约束被满足,以使得只有有效的句子结构才被输出;以及当满足所述一个或多个约束中的每个约束时,将输出回答以句子的形式传达给所述询问。

【技术特征摘要】
【国外来华专利技术】2014.03.25 US 14/224,4301.一种在服务器上用于构造自然语言输出的方法,所述方法包括:从用户处接收语音输入询问;识别响应于所述语音输入询问的回答;将所述回答映射为来自被布置为存储结构化数据的知识库的所述结构化数据,其中,映射将所述回答转变为由自然语言引擎使用的机器能够读取的语言;识别与所述回答被映射为的所述结构化数据相关联的句子结构;将所述回答被映射为的所述结构化数据布置到所述句子结构中;识别与所述句子结构相关联的一个或多个约束被满足,以使得只有有效的句子结构才被输出;以及当满足所述一个或多个约束中的每个约束时,将输出回答以句子的形式传达给所述询问。2.根据权利要求1所述的方法,其中,所述结构化数据是三元组的一个或多个集合。3.根据权利要求1所述的方法,其中,所述输出回答是一个句子的语音输出与web搜索结果页面相组合。4.根据权利要求3所述的方法,其中,所述输出回答还包括文本输出。5.一种用于响应于询问生成自然语言输出的系统,所述系统包括:计算设备,其与具有一个或多个处理器和一个或多个计算机存储介质的自然语言引擎相关联;以及存储器,其包括与所述自然语言引擎耦合的数据存贮;其中,所述自然语言引擎:识别对询问的回答;将所述回答转变为由所述自然语言引擎使用的机器能够读取的语言;将所述回答映射为来自被布置为存储结构化数据的知识库的所述结构化数据;识别与所述结构化数据相关联的句子结构;识别与所述句...

【专利技术属性】
技术研发人员:曹桂宏F·卡拉贝A·穆罕默德
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1