意图知识图谱生成方法、意图识别方法及装置制造方法及图纸

技术编号:22166952 阅读:44 留言:0更新日期:2019-09-21 10:35
本公开提供一种意图知识图谱生成方法、意图识别方法及装置,根据用户历史检索信息,识别与检索词对应的实体和意图,建立检索词和实体之间的第一映射关系,以及检索词和意图之间的第二映射关系,将实体与预设的概念体系中底层的概念关联,并根据资源数据的内容信息和识别出的意图,建立所述资源数据与所述第二映射关系的链接,从而生成意图知识图谱。在进行意图识别时,对于用户输入的实体类检索词,先确定对应的实体,再确定该实体下所有的检索词,从中选择与用户输入的检索词最接近的检索词,并确定相应的第二映射关系,由此获取相关的资源数据。本公开还提供一种服务器和计算机可读介质。

Intention Knowledge Map Generation Method, Intention Recognition Method and Device

【技术实现步骤摘要】
意图知识图谱生成方法、意图识别方法及装置
本公开涉及知识图谱
,具体涉及一种意图知识图谱生成方法及装置、意图识别方法及装置、服务器和计算机可读介质。
技术介绍
在传统的搜索场景中,搜索引擎会根据用户输入的检索词(query),为用户返回相关的检索结果。传统的搜索场景是基于倒排索引和字符串匹配的逻辑为用户返回相关网页或信息,例如:用户检索query=“茶杯犬多少钱一只”,即可根据上述方法,匹配“茶杯犬”及“多少钱”相关的页面给用户。但对于实体类检索(即用户的检索词只有一个实体词,而没有前后缀的辅助信息),检索词可能不会包含用户的检索意图,例如用户检索“茶杯犬”,这种场景下搜索引擎无法通过检索词字面意图获得用户意图,即不知道用户具体想了解茶杯犬哪方面的信息,也就无法准确返回与用户潜在意图相关的结果。因此如何准确识别用户实体类检索词的潜在检索意图,并将其最关注的信息展现出来,是搜索产品在上述场景下满足用户需求的关键。对用户搜索意图的识别,现有技术方案分如下两大类:第一类:直接从检索词中解析出用户意图,主要包括如下两种方案:(1)利用规则模板,从在线或历史检索中解析用户意图,例如query=北京的天气,可利用类似[city][weather]的模板来匹配query,从而解析出其中的用户意图。这种方案一方面只适用于特定场景的、描述比较规范的query;另一方面,一旦检索词的表达方式出现变化,就需要重新定义模板来适配。例如:对检索词为“北京的天气”可以解析,而检索词为“天气北京”就需要新定义模板,这样,模板的维护的管理复杂。(2)利用机器学习模型或深度学习模型从检索词中训练模型识别用户意图。该方案本质上仍然强依赖于检索词的表达,即检索词越完整、越是包含用户意图,模型学习到的结果才能越好。该方案一般用于对话场景,因为对话场景下用户的表达普遍比较完整,而在搜索场景下用户的检索词普遍简单、所以该方案不适用。第二类:先构建意图词典,然后通过检索词与意图词典的匹配度或相似度来识别意图。这类方案的关键在于词典本身的效果,而意图词典的构建一般有以下几种方案:(1)根据历史检索词集合,通过模型训练来得到不同类别组成的意图词典;(2)同样根据历史检索词集合,进行聚类得到基于类别的意图词典;(3)根据检索结果页中网页的点击来分类或训练得到意图分类模型。利用意图词典识别意图,获取到的意图是基于类别的,而不是基于实体粒度的;而且获取到的意图是扁平化的,即没有形成有语义的意图体系,也无法得知获取到的意图究竟是什么意思。第三类:用知识图谱的方法来整合意图,建立意图知识图谱。现有的意图知识图谱,同样是基于类别粒度的,比如:李白和杜甫都是人物,目前只针对“人物”这一粒度来整合意图图谱,而不会细化到李白或杜甫这一实体粒度来整理其意图,更不会细化到针对李白的各种检索表达的层面(比如检索词为李太白、诗仙等),但实际上有相当多的用户意图是与实体及不同的检索表达而有所区别的。
技术实现思路
本公开针对现有技术中存在的上述不足,提供一种意图知识图谱生成方法及装置、意图识别方法及装置、服务器和计算机可读介质。第一方面,本公开实施例提供一种意图知识图谱生成方法,所述方法包括:获取用户历史检索信息,并根据所述用户历史检索信息,识别与检索词对应的实体和意图;建立检索词和实体之间的第一映射关系,以及检索词和意图之间的第二映射关系;将所述实体与预设的概念体系中底层的概念关联,其中,所述概念体系至少包括两层结构;获取资源数据的内容信息,并根据所述内容信息和识别出的意图,建立所述资源数据与所述第二映射关系的链接,以生成意图知识图谱。进一步的,在所述识别与检索词对应的意图之后,所述方法还包括:若相同的意图对应多种意图表达,则建立同一意图与相应的各意图表达之间的第三映射关系。优选的,所述根据所述内容信息和识别出的意图,建立所述资源数据与所述第二映射关系的链接,具体包括:将所述内容信息与识别出的意图相匹配,若匹配,则建立所述资源数据与所述第二映射关系的链接;若不匹配,则根据所述第三映射关系确定相应的意图表达,并将所述内容信息与所述意图表达相匹配,若所述内容信息与至少一个所述意图表达匹配,则建立所述资源数据与所述第二映射关系的链接;所述在建立所述资源数据与所述第二映射关系的链接之后,所述方法还包括:根据匹配程度为所述资源数据设置第一权重。进一步的,在所述第一映射关系中,一个实体对应至少一个检索词;所述方法还包括:若一个实体对应多个检索词,则分别确定该实体的每个检索词对应的意图;根据所述用户历史检索信息确定所述意图的重要性,并根据所述意图的重要性,为相应的第二映射关系设置第二权重。进一步的,在生成意图知识图谱之后,所述方法还包括扩展所述意图知识图谱的步骤,所述扩展所述意图知识图谱的步骤包括:判断属于最底层同一概念下的不同实体对应的检索词之间是否存在非共有的意图;若存在,则根据所述非共有的意图,在所述意图知识图谱中分别补充所述属于最底层同一概念下的不同实体对应的意图;建立已补充意图的实体下的检索词与补充的意图之间的第二映射关系;根据所建立的第二映射关系获取相应的资源数据,并建立获取到的资源数据与所建立的第二映射关系的链接。另一方面,本公开实施例提供一种意图识别方法,所述方法包括:所述方法应用于意图知识图谱,所述意图知识图谱包括:检索词和实体之间的第一映射关系、检索词和意图之间的第二映射关系、以及资源数据与第二映射关系的链接,所述方法包括:判断用户输入的检索词是否为实体类检索词,若是,则根据所述检索词和所述第一映射关系,确定相应的实体;根据所述第一映射关系,确定所述实体对应的检索词,并从中确定与所述用户输入的检索词最接近的检索词;确定与所述用户输入的检索词最接近的检索词对应的第二映射关系;根据确定出的第二映射关系和所述资源数据与第二映射关系的链接,获取并返回相应的资源数据。进一步的,所述意图知识图谱中还包括资源数据的第一权重;所述返回相应的资源数据,具体包括:根据所述意图知识图谱中的第一权重,返回相应的资源数据。优选的,所述第二映射关系具有第二权重;所述根据确定出的第二映射关系和所述资源数据与第二映射关系的链接,获取并返回相应的资源数据,具体包括:若确定出的第二映射关系为多个,则获取各个第二映射关系对应的第二权重;根据所述各个第二映射关系对应的第二权重,获取并返回相应的资源数据。进一步的,所述意图识别方法还包括:若无法确定与所述用户输入的检索词最接近的检索词对应的第二映射关系,则确定其他检索词所对应的第二映射关系,所述其他检索词为,确定出的所述实体对应的检索词中除与所述用户输入的检索词最接近的检索词之外的检索词。又一方面,本公开实施例提供一种意图知识图谱生成装置,所述装置包括:包括:第一获取模块、识别模块、建立模块、关联模块、第二获取模块和链接模块;所述第一获取模块用于,获取用户历史检索信息;所述识别模块用于,根据所述用户历史检索信息,识别与检索词对应的实体和意图;所述建立模块用于,建立检索词和实体之间的第一映射关系,以及检索词和意图之间的第二映射关系;所述关联模块用于,将所述实体与预设的概念体系中底层的概念关联,其中,所述概念体系至少包括两层结构;所述第二获取模块用于本文档来自技高网
...

【技术保护点】
1.一种意图知识图谱生成方法,其中,获取用户历史检索信息,并根据所述用户历史检索信息,识别与检索词对应的实体和意图;建立检索词和实体之间的第一映射关系,以及检索词和意图之间的第二映射关系;将所述实体与预设的概念体系中底层的概念关联,其中,所述概念体系至少包括两层结构;获取资源数据的内容信息,并根据所述内容信息和识别出的意图,建立所述资源数据与所述第二映射关系的链接,以生成意图知识图谱。

【技术特征摘要】
1.一种意图知识图谱生成方法,其中,获取用户历史检索信息,并根据所述用户历史检索信息,识别与检索词对应的实体和意图;建立检索词和实体之间的第一映射关系,以及检索词和意图之间的第二映射关系;将所述实体与预设的概念体系中底层的概念关联,其中,所述概念体系至少包括两层结构;获取资源数据的内容信息,并根据所述内容信息和识别出的意图,建立所述资源数据与所述第二映射关系的链接,以生成意图知识图谱。2.如权利要求1所述的方法,其中,在所述识别与检索词对应的意图之后,所述方法还包括:若相同的意图对应多种意图表达,则建立同一意图与相应的各意图表达之间的第三映射关系。3.如权利要求2所述的方法,其中,所述根据所述内容信息和识别出的意图,建立所述资源数据与所述第二映射关系的链接,具体包括:将所述内容信息与识别出的意图相匹配,若匹配,则建立所述资源数据与所述第二映射关系的链接;若不匹配,则根据所述第三映射关系确定相应的意图表达,并将所述内容信息与所述意图表达相匹配,若所述内容信息与至少一个所述意图表达匹配,则建立所述资源数据与所述第二映射关系的链接;所述在建立所述资源数据与所述第二映射关系的链接之后,所述方法还包括:根据匹配程度为所述资源数据设置第一权重。4.如权利要求1所述的方法,其中,在所述第一映射关系中,一个实体对应至少一个检索词;所述方法还包括:若一个实体对应多个检索词,则分别确定该实体的每个检索词对应的意图;根据所述用户历史检索信息确定所述意图的重要性,并根据所述意图的重要性,为相应的第二映射关系设置第二权重。5.如权利要求1所述的方法,其中,在生成意图知识图谱之后,所述方法还包括扩展所述意图知识图谱的步骤,所述扩展所述意图知识图谱的步骤包括:判断属于最底层同一概念下的不同实体对应的检索词之间是否存在非共有的意图;若存在,则根据所述非共有的意图,在所述意图知识图谱中分别补充所述属于最底层同一概念下的不同实体对应的意图;建立已补充意图的实体下的检索词与补充的意图之间的第二映射关系;根据所建立的第二映射关系获取相应的资源数据,并建立获取到的资源数据与所建立的第二映射关系的链接。6.一种意图识别方法,其中,所述方法应用于意图知识图谱,所述意图知识图谱包括:检索词和实体之间的第一映射关系、检索词和意图之间的第二映射关系、以及资源数据与第二映射关系的链接,所述方法包括:判断用户输入的检索词是否为实体类检索词,若是,则根据所述检索词和所述第一映射关系,确定相应的实体;根据所述第一映射关系,确定所述实体对应的检索词,并从中确定与所述用户输入的检索词最接近的检索词;确定与所述用户输入的检索词最接近的检索词对应的第二映射关系;根据确定出的第二映射关系和所述资源数据与第二映射关系的链接,获取并返回相应的资源数据。7.如权利要求6所述的方法,其中,所述意图知识图谱中还包括资源数据的第一权重;所述返回相应的资源数据,具体包括:根据所述意图知识图谱中的第一权重,返回相应的资源数据。8.如权利要求6所述的方法,其中,所述第二映射关系具有第二权重;所述根据确定出的第二映射关系和所述资源数据与第二映射关系的链接,获取并返回相应的资源数据,具体包括:若确定出的第二映射关系为多个,则获取各个第二映射关系对应的第二权重;根据所述各个第二映射关系对应的第二权重,获取并返回相应的资源数据。9.如权利要求6-8任一项所述的方法,其中,所述方法还包括:若无法确定与所述用户输入的检索词最接近的检索词对应的第二映射关系,则确定其他检索词所对应的第二映射关系,所述其他检索词为,确定出的所述实体对应的检索词中除与所述用户输入的检索词最接近的检索词之外的检索词。10.一种意图知识图谱生成装置,其中,包括:第一获取模块、识别模块、建立模块、关联模块、第二获取模块和链接模块;所述第一获取模块用于,获取用户历史检索信息;所述识别模块用于,根据所述用户历史检索信息,识别与检索词对应的实体和意图;所述建立模块用于,建立检索词和实体之间的第一映射关系,以及检索词和意图之间的第二映射关系;所述关联模块用于,将所述实体与预设的概念体系中底层的概念关联,其中,所述概念体系至少包括两层结构;所述第二获取模块用于,获取资源数据的内容信息;所述链接模块用于,根据所述内容信息和识别出的意图,建立所述资源数据与所述第二映射关系的链接,以生成意图知识图谱。11....

【专利技术属性】
技术研发人员:李然卢佳俊王灿朱嘉琪任可欣
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1