使用多个所选知识库来回答自然语言问题的设备和方法技术

技术编号：12466572 阅读：114 留言：0更新日期：2015-12-09 16:32

一种自然语言问题回答设备包括候选搜索实体、假说生成实体、假说排列实体、和知识库路由实体。所述候选搜索实体被配置成提供针对所接收的自然语言问题的信息单元的多个面向三分法的表示，其中每个面向三分法的表示包括针对面向三分法的表示的知识库特定的概念、概念实例、概念实例关系以及概率值。所述假说生成实体被配置成生成关于在概念、概念实例以及概念实例关系之间的链接的多个假说。所述假说排列实体被配置成基于用所生成的假说而查询辅知识库以及面向三分法的表示的概率值来对所生成的假说进行排列。所述知识库路由实体被配置成基于经排列的假说而从多个可用的知识库中选择多个知识库。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于使用多个所选知识库来自动回答自然语言问题的设备和方法。
技术介绍
当今的企业需要基于分析来自海量且异构的数据库或源的信息而做出决策。对机器或技术安装进行控制的越来越多方面由数据驱动，并且作为结果，越来越多的操作者需要访问数据。构建工业等级的问题回答(QA)系统的挑战是成许多倍的，这不仅是由于底层知识库的领域特异性，而且还因为与系统的用户交互，所述用户交互需要涵盖宽范围的查询。—个挑战是在商用硬件上的运行时性能。例如，可接受的速度可以被定义为在800ms内计算回答表示。系统应当是可伸缩的，因为响应时间不应当与正访问的数据的大小成比例。企业数据是异构且动态的。QA系统需要集成这些源并且适应它们变化的性质。集成过程的部分包括提供用于数据的统一语义学。此外，不同的用户需要访问企业数据，他们中的大多数知道他们想要什么但是不确切知道如何得到它。工业QA系统需要允许它们容易地表述查询，尽可能地接近自然语言。该要求被以下事实所复杂化:大多数使用与其数据有关的领域特定的术语和概念。在问题回答过程中需要捕获和使用该术语学。考虑到操作者多么习惯于以自然语言进行会话，这样的系统必须提供直观的接口用于更正错误，即触及问题的正确含义并且使随后的回答可视化。也就是说，系统用户不仅要求使用(有效的)自然语言问题(例如向我示出在中国的所有活动的单位)、查询语言构造，例如通过按容量降序排序的性能而选择单位名称)，而且还要求使用(传统)关键词搜索(例如，st rna ksp)，或者这些的混合。这可能是重要的，因为常规的语法驱动的方法，例如通过它们的解析树来标识关系(...
<a href="http://www.xjishu.com/zhuanli/55/CN105144205.html" title="使用多个所选知识库来回答自然语言问题的设备和方法原文来自X技术">使用多个所选知识库来回答自然语言问题的设备和方法</a>

【技术保护点】
一种用于使用多个所选知识库而回答自然语言问题（NQ）的自然语言问题回答设备（100），所述设备（100）包括：候选搜索实体（10），其用于提供针对所接收的自然语言问题（NQ）的信息单元的多个面向三分法的表示（TR），其中每个面向三分法的表示（TR）包括针对面向三分法的表示（TR）的知识库特定的概念（C）、概念实例（CI）、概念实例关系（R）以及概率值（PV），假说生成实体（11），其用于生成关于在知识库特定的概念（C）、概念实例（CI）以及概念实例关系（R）之间的链接的多个假说（H），假说排列实体（12），其用于基于用所生成的假说（H）而查询辅知识库以及面向三分法的表示（TR）的概率值（PV）来对所生成的假说（H）进行排列，以及知识库路由实体（13），其用于基于经排列的假说（RH）而从多个可用的知识库中选择多个知识库。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：DG特库奇，U瓦尔廷格，
申请(专利权)人：西门子公司，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人