处理查询的方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:21453990 阅读:34 留言:0更新日期:2019-06-26 04:47
本公开的实施例涉及处理查询的方法、装置、电子设备和计算机可读存储介质。该方法包括:响应于接收到查询,确定查询的类别;基于查询的类别来确定查询的结构化表示;以及基于查询的结构化表示,获取与查询相关联的查询结果。以这种方式,可以方便地获得与特定类别更加适配的查询结果。

【技术实现步骤摘要】
处理查询的方法、装置、电子设备和计算机可读存储介质
本公开的实施例涉及自然语言处理,并且更具体地涉及用于处理查询的方法、装置、电子设备和计算机可读存储介质。
技术介绍
目前,通常使用通用的实体发现和识别技术来处理行业文本数据,以获得相关的查询结果。例如,可以使用通用的意图识别技术和通用的关注点标注技术,根据实体图谱、概念图谱数据等对行业文本数据进行处理。尽管目前已经有较为完备的实体图谱以及概念图谱,但是缺少关注点图谱数据,目前无法满足行业需求,并且数据到应用之间仍然存在较大的鸿沟。通用的实体发现与识别能力在行业文本上效果差,且实体类型体系有差异,无法直接应用。另外,通用的意图识别能力也无法满足行业需求,并且通用关注点标注无法完全满足关注点标注能力,而是需要结合概念图谱、关注点图谱及实体发现和识别在行业进行适配。
技术实现思路
根据本公开的实施例,提供了一种用于处理查询的方案。在本公开的第一方面,提供了一种用于处理查询的方法。该方法包括:响应于接收到查询,确定查询的类别;基于查询的类别来确定查询的结构化表示;以及基于查询的结构化表示,获取与查询相关联的查询结果。在本公开的第二方面,提供了一种用于处理查询的装置。该装置包括:类别确定模块,被配置为响应于接收到查询,确定查询的类别;结构化表示确定模块,被配置为基于查询的类别来确定查询的结构化表示;以及获取模块,被配置为基于查询的结构化表示,获取与查询相关联的查询结果。在本公开的第三方面,提供了一种电子设备。该电子设备包括:一个或多个处理器;以及存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得电子设备实现根据本公开的第一方面的方法。在本公开的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。附图说明结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了能够在其中实现本公开的实施例的示例性环境的示意图;图2示出了根据本公开的一些实施例的用于处理查询的方法的流程图;图3示出了根据本公开的一些实施例的关注点识别模块的示意图;图4示出了根据本公开的一些实施例的属性标注模块的示意图;图5示出了根据本公开的一些实施例的用于处理查询的装置的框图;以及图6示出了能够实施本公开的一些实施例的电子设备的框图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。如上所述,通用的实体发现和识别技术无法满足行业化数据的要求。对此,本公开的实施例提供了一种面向行业知识的结构化文本理解技术。例如,基于查询的类别来确定查询的结构化表示,并且基于查询的结构化表示,获取与查询相关联的查询结果。以下结合图1-图4来具体描述本公开的实施例。图1示出了能够在其中实现本公开的实施例的示例性环境100的示意图。如图1所示,查询102可以是文本查询、语音查询或者两者的结合。例如,语音查询可以首先被转换为文本,以进行进一步处理。查询102可以具有各种形式,例如,用户在搜索框中输入的查询文本或者某些网站的标题,例如,“三棵树地板本色油漆多少钱一组?”查询102可以是与特定类别相关联,这些类别可以是行业或领域,例如,装修、奢侈品、幼儿教育、家电、美食等。为了方便起见,以下主要结合行业来描述本公开的实施例,然而,应当理解,本公开的原理也可以应用于其他分类。如图1所示,分类模块103对查询102进行分类,以获得查询102相关联的类别,例如,行业或领域。然后,将查询102调度给相应的模型,例如,行业模型104,其与特定的行业相关联。行业模型104可以确定查询102的结构化表示。该结构化表示还可以包括查询102的意图或关注点,这可以通过关注点识别模块106来获得。例如,“三棵树地板本色油漆多少钱一组”的关注点或意图可以是产品价格。应当理解,尽管图1示出了一个行业模型104,但是环境100可以包括多个行业模型,每一个行业模型对应于一个特定行业,或者更广义的类别。另外,结构化表示可以包括实体及其相对应的属性,这可以由属性标注模块108来获得。例如,对于“三棵树地板本色油漆多少钱一组”而言,实体可以是三棵树、地板、油漆、地面装修、油漆涂料,并且其对应的属性可以是品牌、装修品类、装修品类、装修项目、装修项目。基于查询102的结构化表示,可以获取与查询102相关联的查询结果。例如,在该示例中,可以获得三棵树地板本色油漆的价格以及相应的购物网站。图2示出了根据本公开的一些实施例的用于处理查询的方法200的流程图。例如,方法200可以在环境100中实现。然而,应当理解,方法200也可以在任何其他合适的环境中实现。在框202,响应于接收到查询,确定查询的类别。例如,框202可以通过图1所示的分类模块103来实现。分类模块103可以是文本分类模型,其可以对查询进行需求识别,明确用户所关注的行业领域。分类模块103可以由神经网络来实现,例如,深度神经网络(DNN)。分类模块103可以通过基于不同行业的查询来训练一个多分类模型来实现。例如,训练数据可以包括查询文本以及与查询文本对应的行业标签。在框204,基于查询的类别来确定查询的结构化表示。查询的结构化表示可以包括实体及其对应的属性,并且还可以包括与查询对应或相关联的关注点。例如,框202可以通过行业模型104来实现。在一些实施例中,基于查询的类别来识别查询的关注点。例如,可以通过特定于该类别的关注点识别模块106来识别查询的关注点。例如,可以基于与类别相关联的预定义规则来识别查询的关注点。备选地或附加地,可以通过与类别相关联的神经网络模型来识别查询的关注点。图3示出了根据本公开的一些实施例的关注点识别模块106的示意图。关注点识别模块106也可以被称为意图识别模块,其判断用户在行业领域的倾向以及对于行业产品的关注点,从而进一步理解用户的需求意图。例如,对于“浪鲸卫浴怎么样”,用户关注点或意图是产品质量。如图3所示,查询可以被提供给基于行业领域的模型302,并获得相应的意图结果。模型302可以是基于神经网络的多分类模型,例如,深度神经网络(DNN)。该模型可以通过行业领域的本文数据进行训练,以抽取用户的意图。另外,查询也可以被提供给基于规则的模块304。基于规则的模块可以基于与该行业相关联的预定义规则来识别查询的关注点。例如,用户可以对规则进行定制。意图融合模块306可以将基于行业领域的模型302和基于规则的模块304的结果进行合并筛选,以最终在意图结果产出模块308产出最终的意图结果。在一些实施例中,如果基于规则的模块304可以确定查询的意图或关注点,则可以将该意图或关注点作为最终的意图结果本文档来自技高网
...

【技术保护点】
1.一种用于处理查询的方法,包括:响应于接收到查询,确定所述查询的类别;基于所述查询的所述类别来确定所述查询的结构化表示;以及基于所述查询的结构化表示,获取与所述查询相关联的查询结果。

【技术特征摘要】
1.一种用于处理查询的方法,包括:响应于接收到查询,确定所述查询的类别;基于所述查询的所述类别来确定所述查询的结构化表示;以及基于所述查询的结构化表示,获取与所述查询相关联的查询结果。2.根据权利要求1所述的方法,其中确定所述查询的结构化表示包括:基于所述类别,识别所述查询的关注点;基于所述类别,识别与所述查询相关联的实体和与所述实体对应的属性;以及基于所述关注点、所述实体以及所述属性,确定所述查询的结构化表示。3.根据权利要求2所述的方法,其中识别所述查询的关注点包括以下至少一项:基于与所述类别相关联的预定义规则来识别所述查询的所述关注点;以及通过与所述类别相关联的神经网络模型来识别所述查询的所述关注点。4.根据权利要求2所述的方法,其中识别所述实体和与所述实体对应的属性包括:基于通用属性标注模型,识别所述实体和所述实体的通用属性;基于与所述类别相关联的属性标注模型,识别所述实体的特定属性;以及基于所述通用属性和所述特定属性,获得与所述实体对应的所述属性。5.根据权利要求4所述的方法,其中识别所述实体和所述实体的通用属性包括:通过命名实体识别来确定与所述查询相关联的实体和所述实体的类型;以及响应于所述类型与预定义的属性映射库中的类型匹配,从所述属性映射库中确定与所述类型对应的、与所述类别相关联的目标属性以作为所述通用属性,所述属性映射库包括所述类型与所述目标属性的映射关系。6.根据权利要求4所述的方法,其中识别所述实体的特定属性包括以下至少一项:响应于与所述查询相关联的实体与关联于所述类别的实体属性库中的实体匹配,基于所述实体属性库来确定所述实体的特定属性;以及通过与所述类别相关联的神经网络模型来确定所述实体的特定属性。7.根据权利要求1所述的方法,其中确定所述查询的类别包括确定与所述查询相关联的行业。8.根据权利要求1所述的方法,其中所述查询包括文本查询和语音查询中的至少一种。9.一种用于处理查询的装置,包括:类别确定模块,被配置为响应于接收到查询,确定所述查询的类别;结构化表示确定模块,被配置为基于所述查询的所述类别来确定所述查询的结构化表示;以及获取模块,被配置为基于所述查询的结构化表示,获取与所述查询相关联的查询结果。10.根据权利要求9所述的装置,其中结构化表示确定模块包括:关注点识别模块,被配置为基于所述类别,...

【专利技术属性】
技术研发人员:王述汪琦方舟冯知凡张扬朱勇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1