意图识别方法、装置、设备以及存储介质制造方法及图纸

技术编号:36791926 阅读:11 留言:0更新日期:2023-03-08 22:44
本公开提供了意图识别方法、装置、设备以及存储介质,涉及人工智能领域,尤其涉及自然语言处理和智能搜索技术领域。具体实现方案为,通过将搜索条件信息与品类词库中的下位标签进行匹配,以确定品类词库中匹配的目标标签的个数大于数量阈值的目标品类,进而根据目标品类下匹配的各目标标签的字符长度、各所述目标标签的权重和/或所述目标品类与所述搜索条件信息之间的词向量相似度,确定所述目标品类是否为所述搜索条件信息的搜索意图。采用数量阈值筛选出目标标签的个数大于数量阈值的目标品类,缩小了符合用户意图的品类范围。再通过字符长度、标签的权重和词向量相似度,最终确定目标品类是否为搜索意图,提高了意图识别的准确性。的准确性。的准确性。

【技术实现步骤摘要】
意图识别方法、装置、设备以及存储介质


[0001]本公开涉及人工智能
,具体涉及自然语言处理、智能搜索和信息推荐
,可应用于搜索和推荐等场景,尤其涉及意图识别方法、装置、设备以及存储介质。

技术介绍

[0002]用户或者商家为了能够搜索到所需的信息,通常会在通用的搜索引擎,或者,在特定的搜索引擎中输入搜索条件信息。进而,搜索引擎基于该搜索条件信息进行搜索,并将搜索到的信息向用户或者商家进行推送。
[0003]为了使得推送的信息满足用户或者商家的需求,准确识别用户和商家的意图,则显得至关重要。

技术实现思路

[0004]本公开提供了一种意图识别方法、装置、设备以及存储介质。
[0005]根据本公开的一方面,提供了一种意图识别方法,包括:
[0006]获取待意图识别的搜索条件信息,以及获取设定的品类词库,其中,所述品类词库中包括多个品类,所述多个品类中的任一品类包含有携带权重的下位标签;
[0007]将所述搜索条件信息与所述品类词库中的下位标签进行匹配,以确定所述品类词库中匹配的目标标签的个数大于数量阈值的目标品类;
[0008]根据所述目标品类下匹配的各目标标签的字符长度、各所述目标标签的权重和/或所述目标品类与所述搜索条件信息之间的词向量相似度,确定所述目标品类是否为所述搜索条件信息的搜索意图。
[0009]根据本公开的另一方面,提供了一种意图识别装置,包括:
[0010]获取模块,用于获取待意图识别的搜索条件信息,以及获取设定的品类词库,其中,所述品类词库中包括多个品类,所述多个品类中的任一品类包含有携带权重的下位标签;
[0011]匹配模块,用于将所述搜索条件信息与所述品类词库中的下位标签进行匹配,以确定所述品类词库中匹配的目标标签的个数大于数量阈值的目标品类;
[0012]识别模块,用于根据所述目标品类下匹配的各目标标签的字符长度、各所述目标标签的权重和/或所述目标品类与所述搜索条件信息之间的词向量相似度,确定所述目标品类是否为所述搜索条件信息的搜索意图。
[0013]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面实施例所述的方法。
[0014]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行本公开第一方面实施例所述的方法。
[0015]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开第一方面实施例所述的方法。
[0016]本公开提供的意图识别方法、装置、设备以及存储介质,通过将搜索条件信息与品类词库中的下位标签进行匹配,以确定品类词库中匹配的目标标签的个数大于数量阈值的目标品类,进而根据目标品类下匹配的各目标标签的字符长度、各所述目标标签的权重和/或所述目标品类与所述搜索条件信息之间的词向量相似度,确定所述目标品类是否为所述搜索条件信息的搜索意图。通过在品类词库中预先为每种品类设置下位标签,采用设定的数量阈值筛选出匹配的目标标签的个数大于数量阈值的目标品类,从而缩小了符合用户意图的品类范围。在目标品类中,再通过字符长度、标签的权重和词向量相似度等多种手段的结合,最终确定目标品类是否为搜索意图,从而提高了意图识别的准确性。
[0017]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0018]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0019]图1为本公开实施例提供的一种意图识别方法的流程示意图;
[0020]图2为本公开实施例提供的另一种意图识别方法的流程示意图;
[0021]图3为本公开实施例提供的另一种意图识别方法的流程示意图;
[0022]图4为本公开实施例提供的另一种意图识别方法的流程示意图;
[0023]图5为本公开实施例所示出的意图识别装置500的结构示意图;
[0024]图6为用来实施本公开的实施例的示例电子设备600的示意性框图。
具体实施方式
[0025]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0026]招商加盟相关信息的搜索,是搜索的方向之一。在相关的招商加盟搜索引擎上,每天都会有大量用户搜索自己的需求,同时也有大量的商家需要精准的线索。为了准确理解用户和商家的海量需求。构建招商加盟搜索方向的意图理解体系显得至关重要。
[0027]在意图的划分上,粗略的划分可以划分为,强意图,弱意图(泛意图),其他意图(非加盟意图)等。而强意图又可以细分为品牌意图和品类意图。
[0028]相关技术中,可以基于数据标注进行模型训练,这一方法的难点在于当识别类型过多时,人工标注成本较高,标注难度较大,耗时长,模型效果一般。基于无监督学习构建词向量,通过计算文本和标签词向量之间的距离来进行识别。虽然节省了人力标注成本,但是效果往往不如监督学习。
[0029]针对以上问题,本公开实施例提供了意图识别方法、装置、设备以及存储介质,通过将搜索条件信息与品类词库中的下位标签进行匹配,以确定品类词库中匹配的目标标签的个数大于数量阈值的目标品类,进而根据目标品类下匹配的各目标标签的字符长度、各
所述目标标签的权重和/或所述目标品类与所述搜索条件信息之间的词向量相似度,确定所述目标品类是否为所述搜索条件信息的搜索意图。
[0030]通过在品类词库中预先为每种品类设置下位标签,采用设定的数量阈值筛选出匹配的目标标签的个数大于数量阈值的目标品类,从而缩小了符合用户意图的品类范围。在目标品类中,再通过字符长度、标签的权重和词向量相似度等多种手段的结合,最终确定目标品类是否为搜索意图,从而提高了意图识别的准确性。
[0031]图1为本公开实施例提供的一种意图识别方法的流程示意图,如图1所示,包括:
[0032]步骤101,获取待意图识别的搜索条件信息,以及获取设定的品类词库,其中,所述品类词库中包括多个品类,所述多个品类中的任一品类包含有携带权重的下位标签。
[0033]本实施例中,权重,是用户对下位标签感兴趣的程度。具体可以是采用以下方式衡量:针对全量用户历史推荐该品类,或者该下位标签相关的信息时,该信息被浏览或者收藏的概率,即点击率。
[0034]品类词库中包括多种品类,在招商加盟的搜索方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,包括:获取待意图识别的搜索条件信息,以及获取设定的品类词库,其中,所述品类词库中包括多个品类,所述多个品类中的任一品类包含有携带权重的下位标签;将所述搜索条件信息与所述品类词库中的下位标签进行匹配,以确定所述品类词库中匹配的目标标签的个数大于数量阈值的目标品类;根据所述目标品类下匹配的各目标标签的字符长度、各所述目标标签的权重和/或所述目标品类与所述搜索条件信息之间的词向量相似度,确定所述目标品类是否为所述搜索条件信息的搜索意图。2.根据权利要求1所述的方法,其中,所述根据所述目标品类下匹配的各目标标签的字符长度、各所述目标标签的权重和/或所述目标品类与所述搜索条件信息之间的词向量相似度,确定所述目标品类是否为所述搜索条件信息的搜索意图,包括:对同一目标品类下的各所述目标标签,根据各所述目标标签的权重,对各所述目标标签的字符长度进行加权平均,以确定对应目标品类的预测概率,其中,所述预测概率用于指示对应目标品类为搜索意图的概率;将所述搜索条件信息输入经过训练的语言模型,以根据所述语言模型对所述搜索条件信息编码得到的词向量,确定与各所述下位标签的词向量之间的词向量相似度;根据所述搜索条件信息与各所述下位标签的词向量之间的相似度,从所述品类词库的多个品类中确定候选品类的集合;在所述候选品类的集合中包含所述目标品类,且所述目标品类的所述预测概率满足设定条件的情况下,将所述目标品类作为所述搜索条件信息的搜索意图。3.根据权利要求2所述的方法,其中,所述目标品类为多个,所述方法还包括:在所述候选品类的集合中包含目标品类,且所述候选品类的集合中所包含的目标品类的预测概率不满足设定条件的情况下,将多个目标品类中所述预测概率排序在前设定个数的目标品类作为所述搜索条件信息的搜索意图。4.根据权利要求2所述的方法,其中,所述方法还包括:在所述候选品类的集合中未包含所述目标品类,或者,所述目标品类的所述预测概率均不满足设定条件的情况下,从所述候选品类中确定所述搜索条件信息的搜索意图。5.根据权利要求2所述的方法,其中,所述将所述搜索条件信息输入经过训练的语言模型,以根据所述语言模型对所述搜索条件信息编码得到的词向量,确定与各所述下位标签的词向量之间的词向量相似度,包括:将所述搜索条件信息的词向量输入用于层级分类的语言模型中的第一分类层,以基于所述第一分类层的输出确定所述搜索条件信息与所述品类词库中各品类的词向量相似度;将所述搜索条件信息和所述品类词库中各品类的词向量相似度,输入所述用于层级分类的语言模型中的第二分类层,以基于所述第二分类层的输出确定所述搜索条件信息与所述品类词库中各下位标签的词向量相似度。6.根据权利要求1-5任一项所述的方法,其中,所述方法还包括:根据最近设定时长的历史推荐行为中基于任一下位标签所推荐信息的点击率,确定所述品类词库中各所述下位标签携带的权重。7.根据权利要求1-5任一项所述的方法,其中,所述将所述搜索条件信息与所述品类
词库中的下位标签进行匹配,以确定所述品类词库中匹配的目标标签的个数大于数量阈值的目标品类,包括:获取所述品类词库对应的字典树;其中,所述字典树中的节点包括一个根节点和多个叶子节点,以及多个包含字符的中间节点,5每个所述叶子节点对应一个所述下位标签,从所述根节点到任意的一个叶子节点之间的路径上,各中间节点所包含的字符进行顺序组合得到所述一个叶子节点对应的下位标签;将所述搜索条件信息中各字符分别作为字符串起点,在所述字典树中从根节点向叶子节点方向查询,以确定目标路径,其中,所0述目标路径上各中间节点所包含的字符在目标路径上的排序,与所述搜索条件信息中的至少一个字符串中的字符排序相同;将所述目标路径上叶子节点对应的下位标签,确定为与所述搜索条件信息匹配的目标标签;基于与所述搜索条件信息匹配的各目标标签所属的品类,确定5匹配的目标标签的个数大于数量阈值的目标品类。8.根据权利要求1-5任一项所述的方法,其中,所述搜索条件信息与所述品类词库中的下位标签进行匹配之前,还包括:将所述搜索条件信息与品牌词库中的各品牌词进行匹配;0确定所述品牌词库中未存在匹配的目标品牌词。9.根据权利要求8所述的方法,其中,所述方法还包括:在所述品牌词库中存在匹配的目标品牌词的情况下,查询知识图谱,以得到所述目标品牌词的品类描述信息;5基于所述品类描述信息,将对应的品类作为所述搜索条件信息的搜索意图。10.一种意图识别装置,包括:获取模块,用于获取待意图识别的搜索条件信息,以及获取设0定的品类词库,其中,所述品类词库中包括多个品类,所述...

【专利技术属性】
技术研发人员:黄乾飞
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1