用于自然语言查询处理的基于示例的本体论训练制造技术

技术编号:32093972 阅读:12 留言:0更新日期:2022-01-29 18:24
在一些示例中,用于自然语言查询处理的基于示例的本体论训练可以包括:基于通过使用本体论对查询的分析来标识查询中包括未知含义的术语。查询可以是自然语言格式。基于查询的上下文,可以推断该术语的建议定义。基于该术语的建议定义,可以生成用以提供该术语的定义或者修改该术语的建议定义的请求。可以接收对该请求的回复。回复可以是自然语言格式。可以分析回复以更新该术语的建议定义。本体论可以被修改以包括术语的经更新的定义。基于经修改的本体论,可以生成对查询的响应。可以生成对查询的响应。可以生成对查询的响应。

【技术实现步骤摘要】
【国外来华专利技术】用于自然语言查询处理的基于示例的本体论训练

技术介绍

[0001]诸如自然语言查询系统的查询系统可以被用来基于对诸如结构化数据的数据的分析来提供对查询的响应。例如,用户可以对用户为母语的自然语言格式来呈现查询并且接收响应,而无需用户将查询转换为特定于计算机的语言。
附图说明
[0002]本公开的特征通过示例的方式被图示出并且不限于(多个)以下附图,其中相同的数字指示相同的元件,其中:
[0003]图1图示了根据本公开实施例的、用于自然语言查询处理基于示例的本体论(“ontology”)训练的装置布局;
[0004]图2至图4图示了图形用户界面(GUI)显示,用于图示根据本公开的实施例的用于图1的自然语言查询处理装置的基于示例的本体论训练的操作;
[0005]图5图示了根据本公开的实施例的用于自然语言查询处理的基于示例的本体论训练的示例框图;
[0006]图6图示了根据本公开的实施例的用于自然语言查询处理的基于示例的本体论训练的示例方法的流程图;以及
[0007]图7图示了根据本公开的另一实施例的用于自然语言查询处理的基于示例的本体论训练的另一示例框图。
具体实施方式
[0008]为了简单和说明的目的,主要通过参考示例来描述本公开。在以下描述中,阐述了许多具体细节以便提供对本公开的透彻理解。然而,明显的是,可以在不限于这些具体细节的情况下实践本公开。在其他情形中,未详细描述一些方法和结构以免不必要地模糊本公开。
[0009]贯穿本公开,术语“一”和“一个”旨在标示特定元素中的至少一个。如本文中所使用的,术语“包括”意指包括但不限于,术语“包含”意指包含但不限于。术语“基于”意指至少部分地基于。
[0010]在本文中公开了用于自然语言查询处理的基于示例的本体论训练的装置、用于自然语言查询处理的基于示例的本体论训练的方法、以及其上存储有机器可读指令以提供用于自然语言查询处理的基于示例的本体论训练的非暂态计算机可读介质。为了生成对查询的响应,本文所公开的装置、方法和非暂态计算机可读介质提供来自查询中术语的标识,其中术语包括未知含义。基于查询的上下文,可以为该术语推断建议定义。用户(诸如,领域专家)可以经由提示来接收关于针对该术语的、预期什么类型的定义的指导。例如,可以针对用户生成请求,以提供针对术语的定义,或者修改针对术语的建议定义。针对请求所接收的回复可以被用来更新针对该术语的建议定义,并且修改本体论以包括经更新的定义。经修改的本体论可以被用以生成对查询的响应。
[0011]关于诸如自然语言查询系统的查询系统,可以被用以实现此类查询系统的技术示例可以包括基于统计人工智能的查询系统和基于符号人工智能的查询系统。
[0012]基于统计人工智能的查询系统可以实现诸如隐马尔可夫(“Markov”)模型和深度神经网络的技术。可以通过提供具有对应的结构化计算机查询的样本自然语言问题的相对大量的注释对来训练这样的系统。系统然后可以从该训练数据中进行概括以将独特的新查询转换为结构化计算机查询。
[0013]基于符号人工智能的查询系统可以利用规则集和试探法来在关于数据源的编码事实知识的上下文中解释查询。根据本文所公开的示例,规则可以指示形容词修饰名词以及其他此类关系。根据本文所公开的示例,试探法可以指示更远相关的对象不太可能是用户想要的,以及其他这样的方面。根据本文所公开的示例,事实知识可以包括关于在最终退货日期退回产品的顾客的知识以及其他这种事实。目标数据源可以包括任何类型的数据源,诸如关系数据库以及其他这种数据源。
[0014]关于基于符号人工智能的查询系统,用户可以规定诸如“Which customers bought cheese?”(哪些顾客购买了奶酪?)之类的查询。基于符号人工智能的查询系统可以包括关于英语结构的先天知识(例如,包括单词“which”(哪些)指示以下单词标识感兴趣的主题)。基于符号人工智能的查询系统还可以包括关于特定目标结构化数据源的知识(例如,单词“customer”(顾客)指的是数据源的CUSTOMER(顾客)表中的行)。单词“cheese”(奶酪)可以作为值出现在数据源的PRODUCT(产品)表的名称列中。此外,“customers buy products”(顾客购买产品)可以作为具化在数据源的ORDER(订单)表中的关系而被包括。基于关于数据源的这些事实,以及系统对语言结构和查询结构的知识,结构化计算机查询可以被构造为“Select CUSTOMER From ORDER Where PRODUCT.Name=

cheese
’”
(从订单中选择顾客,其中产品名称=

奶酪

)。
[0015]基于符号人工智能的查询系统的方面可以包括收集关于数据源的相关知识。如果没有这种知识,基于符号人工智能的查询系统的能力可能仅限于包括已知含义的术语。就此而言,虽然可能会猜到一些通用术语(例如,“customer”(顾客)可能指的是CLIENT(客户)表中的角色,并且如果数据源包括顾客和产品,则“customers buy products”(顾客购买产品)可能是可能的结论),但是领域特定的词汇和关系可能是常见的,并且可能需要对基于符号人工智能的查询系统而进行明确教导。例如,为了解释查询“how many red gauge sensors have registered warnings against B74”(有多少红色仪表传感器已经针对B74注册警告),系统可能需要知道红色仪表传感器具有type(类型)=R,并且需要知道仪表针对控制块注册了警告(除了数据源中的哪些对象表示传感器、警告和控制块之外)。
[0016]因此,关于基于符号人工智能的查询系统,积累符号自然语言查询处理可能所需要的知识(诸如,领域特定的知识)具有技术挑战性。就此而言,解决这些技术挑战的一种技术可以包括实现数据输入方法,领域专家可以通过该方法直接向基于符号人工智能的查询系统提供事实。例如,可以提供用户界面以允许用户(诸如,领域专家)将“同义词”绑定到数据源中的表和列,并且可以提供另一用户界面以允许用户定义“短语”,该短语描述人们如何谈论数据存储库中的对象之间的关系(例如,“employees provide customers refunds for products”(员工为顾客提供产品退款))。解决上述技术挑战的另一技术可以包括将广谱本体论(或一个或多个通用领域特定的本体论)应用到数据源,目的是确定针对每个对象
和/或关系的最佳可能匹配。解决上述技术挑战的这种技术(例如,应用广谱本体论)可以包括关于准确性(例如,由于应用了不适用的术语)和召回(例如,由于高频共享本体论中可能不存在的独特领域特定的术语)的进一步技术挑战性。本文所公开的装置、方法和非暂态计算机可读介质通过实现用于响应于自然语言查询的本体论的基于示例的训练来至少解决上述技术挑战性。
[0017]关于通过本文所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种装置,包括:处理器;以及存储器,存储机器可读指令,所述机器可读指令在由所述处理器执行时,使所述处理器:基于通过使用本体论对查询的分析,标识所述查询中包括未知含义的术语,其中所述查询为自然语言格式;基于所述查询的上下文,推断所述术语的建议定义;基于所述术语的所述建议定义,生成用以提供所述术语的定义或者修改所述术语的所述建议定义的请求;接收对所述请求的回复,其中所述回复为自然语言格式;分析所述回复,以更新所述术语的所述建议定义;修改所述本体论,以包括所述术语的经更新的所述定义;以及基于经修改的所述本体论,生成对所述查询的响应。2.根据权利要求1所述的装置,其中基于通过使用所述本体论对所述查询的所述分析,来标识所述查询中包括所述未知含义的所述术语的所述指令还使所述处理器:将所述查询转换为计算机可执行查询;以及基于通过使用所述本体论对所述计算机可执行查询的所述分析,标识所述查询中包括所述未知含义的所述术语。3.根据权利要求1所述的装置,其中分析所述回复以更新所述术语的所述建议定义的所述指令还使所述处理器:将所述回复转换为计算机可执行回复;以及分析所述计算机可执行回复,以更新所述术语的所述建议定义。4.根据权利要求1所述的装置,其中基于所述术语的所述建议定义,生成用以提供所述术语的所述定义或者修改所述术语的所述建议定义的所述请求的所述指令还使所述处理器:基于所述术语的所述建议定义,生成用以提供所述术语的所述定义、批准所述术语的所述建议定义、或者修改所述术语的所述建议定义的所述请求。5.根据权利要求1所述的装置,其中基于所述查询的上下文,推断所述术语的所述建议定义的所述指令还使所述处理器:为所述术语指派占位符含义;使用所述占位符含义来解释所述查询;以及基于所述查询的所述上下文和指派给所述术语的所述占位符含义,推断所述术语的所述建议定义。6.根据权利要求1所述的装置,其中所述指令还使所述处理器:确定所述术语是否能够解释为名词;以及基于确定所述术语能够解释为所述名词,将所述术语的所述建议定义推断为数据源中的对象的同义词、所述数据源中的数据值的同义词或所述数据源中的所述对象的条件。7.根据权利要求1所述的装置,其中所述指令还使所述处理器:确定所述术语是否能够解释为形容词;
基于确定所述术语能够解释为所述形容词,确定所述术语是否可解释为最高级,或者所述术语是否为数据源中的对象的值;基于确定所述术语能够解释为所述最高级,将所述术语的所述建议定义推断为经由另一测量范围对象而与对象相关;以及基于确定所述术语能够解释为所述数据源中的所述对象的所述值,将所述术语的所述建议定义推断为与所述数据源中的所述对象以及所述数据源中的相关联的主要对象相关。8.根据权利要求1所述的装置,其中所述指令还使所述处理器:确定所述术语是否能够解释为动词;以及基于确定所述术语能够解释为所述动词,根据数据源中的多个对象之间的...

【专利技术属性】
技术研发人员:C
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1