文本搜索意图识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33707696 阅读:62 留言:0更新日期:2022-06-06 08:33
本公开提供了一种文本搜索意图识别方法、装置、电子设备及存储介质,涉及计算机互联网技术领域。该方法包括:获取目标用户输入的搜索文本,以及目标用户的基本属性信息和行为偏好数据;根据搜索文本,生成文本向量化编码特征;根据目标用户的基本属性信息和行为偏好数据,生成用户向量化编码特征;将文本向量化编码特征和用户向量化编码特征输入到预先练好的意图识别模型中,输出搜索文本的意图识别结果。本公开能够准确识别出不同用户的搜索意图,更精准地定位搜索结果,提供个性化服务。提供个性化服务。提供个性化服务。

【技术实现步骤摘要】
文本搜索意图识别方法、装置、电子设备及存储介质


[0001]本公开涉及计算机互联网
,尤其涉及一种文本搜索意图识别方法、装置、电子设备及存储介质。

技术介绍

[0002]文本搜索是指由手机、计算机等智能设备上提供的应用程序接收用户输入的搜索文本,并向用户返回搜索结果的过程。因而,如何理解用户搜搜意图,对于返回准确的搜索结果,显得十分重要。
[0003]在商机内容文本搜索领域,由于搜索内容比较广泛,涉及人、公司、项目、商机、直播、头条等方面,不同的用户,搜索意图不尽相同。与其他领域相比,商机内容搜索领域的用户登录信息维度也相对较多,包含个人、公司、行为、社交等诸多维度信息。另外,对于同一搜索内容,不同用户由于自身属性和行为偏好等原因,其搜索意图也不完全一致,例如,同样是搜索“科技”关键词,偏好看项目的用户其实是想搜索科技项目,而偏好看头条的用户更希望看到科技资讯。
[0004]显然,目前相关技术中提供的分词+全文检索的搜索方案,难以向用户提供个性化搜索服务,用户体验较差。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开提供一种文本搜索意图识别方法、装置、电子设备及存储介质,至少在一定程度上克服相关技术中的文本搜索方案难以向用户提供个性化搜索服务的技术问题。
[0007]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0008]根据本公开的一个方面,提供了一种文本搜索意图识别方法,该方法包括:获取目标用户输入的搜索文本,以及目标用户的基本属性信息和行为偏好数据;根据搜索文本,生成文本向量化编码特征;根据目标用户的基本属性信息和行为偏好数据,生成用户向量化编码特征;将文本向量化编码特征和用户向量化编码特征输入到预先练好的意图识别模型中,输出搜索文本的意图识别结果。
[0009]在一些实施例中,根据搜索文本,生成文本向量化编码特征包括:对搜索文本进行分词,得到包含一个或多个词语的分词列表;根据分词列表,获取至少一个命名实体和至少一个内容标签;根据搜索文本以及搜索文本对应的词语、命名实体和内容标签,生成搜索文本对应的文本向量化编码特征。
[0010]在一些实施例中,根据目标用户的基本属性信息和行为偏好数据,生成用户向量化编码特征包括:根据目标用户的基本属性信息,生成第一向量;根据目标用户的行为偏好数据,生成第二向量;对第一向量和第二向量进行拼接;将拼接结果输入到预先训练好的文
本卷积神经网络模型中,生成目标用户的用户向量化编码特征。
[0011]在一些实施例中,本公开实施例中提供的文本搜索意图识别方法还包括:根据目标用户的基本属性信息,生成目标用户的dense特征。
[0012]在一些实施例中,将文本向量化编码特征和用户向量化编码特征输入到预先练好的意图识别模型中,输出搜索文本的意图识别结果包括:根据文本向量化编码特征和用户向量化编码特征,生成交叉向量编码特征,其中,交叉向量编码特征为文本向量化编码特征和用户向量化编码特征的内积;将文本向量化编码特征、用户向量化编码特征、交叉向量编码特征以及目标用户的dense特征,输入到预先练好的意图识别模型中,输出搜索文本的意图识别结果。
[0013]在一些实施例中,本公开实施例中提供的文本搜索意图识别方法还包括:获取样本数据,其中,样本数据中包括多个用户输入搜索文本时获取到的dense特征、文本向量化编码特征、用户向量化编码特征、交叉向量编码特征以及对应的意图标签;根据样本数据,对预先搭建的深度神经网络分类模型进行训练,得到意图识别模型,其中,深度神经网络分类模型包括:一个深度神经网络和多个二分类神经网络,其中,二分类神经网络的数量等于意图个数。
[0014]在一些实施例中,意图识别结果包括:一个或多个意图分类,以及搜索文本属于每个意图分类的概率。
[0015]根据本公开的另一个方面,还提供了一种文本搜索意图识别装置,包括:数据获取模块,用于获取目标用户输入的搜索文本,以及目标用户的基本属性信息和行为偏好数据;数据处理模块,用于根据搜索文本,生成文本向量化编码特征;根据目标用户的基本属性信息和行为偏好数据,生成用户向量化编码特征;搜索意图识别模块,用于将文本向量化编码特征和用户向量化编码特征输入到预先练好的意图识别模型中,输出搜索文本的意图识别结果。
[0016]根据本公开的另一个方面,还提供了一种电子设备,该电子设备包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项文本搜索意图识别方法。
[0017]根据本公开的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一项的文本搜索意图识别方法。
[0018]本公开的实施例所提供的文本搜索意图识别方法、装置、电子设备及存储介质,通过机器学习训练一个多分类的意图识别模型,结合用户的基本属性信息和行为偏好数据,对用户输入的搜索文本进行意图识别,能够准确识别出不同用户的搜索意图,更精准地定位搜索结果,提供个性化服务。
[0019]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0020]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
这些附图获得其他的附图。
[0021]图1示出本公开实施例中一种文本搜索意图识别系统架构示意图;
[0022]图2示出本公开实施例中一种文本搜索意图识别方法流程图;
[0023]图3示出本公开实施例中一种对搜索文本进行编码的流程图;
[0024]图4示出本公开实施例中一种对用户信息进行编码的流程图;
[0025]图5示出本公开实施例中一种意图识别模型示意图;
[0026]图6示出本公开实施例中一种意图识别模型的训练流程图;
[0027]图7示出本公开实施例中一种搜索意图识别流程图;
[0028]图8示出本公开实施例中一种文本搜索意图识别装置示意图;
[0029]图9示出本公开实施例中一种电子设备的结构框图;
[0030]图10示出本公开实施例中一种计算机存储介质示意图。
具体实施方式
[0031]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本搜索意图识别方法,其特征在于,包括:获取目标用户输入的搜索文本,以及所述目标用户的基本属性信息和行为偏好数据;根据所述搜索文本,生成文本向量化编码特征;根据所述目标用户的基本属性信息和行为偏好数据,生成用户向量化编码特征;将所述文本向量化编码特征和所述用户向量化编码特征输入到预先练好的意图识别模型中,输出所述搜索文本的意图识别结果。2.根据权利要求1所述的文本搜索意图识别方法,其特征在于,所述根据所述搜索文本,生成文本向量化编码特征包括:对所述搜索文本进行分词,得到包含一个或多个词语的分词列表;根据分词列表,获取至少一个命名实体和至少一个内容标签;根据所述搜索文本以及所述搜索文本对应的词语、命名实体和内容标签,生成所述搜索文本对应的文本向量化编码特征。3.根据权利要求1所述的文本搜索意图识别方法,其特征在于,所述根据所述目标用户的基本属性信息和行为偏好数据,生成用户向量化编码特征包括:根据所述目标用户的基本属性信息,生成第一向量;根据所述目标用户的行为偏好数据,生成第二向量;对第一向量和第二向量进行拼接;将拼接结果输入到预先训练好的文本卷积神经网络模型中,生成所述目标用户的用户向量化编码特征。4.根据权利要求1所述的文本搜索意图识别方法,其特征在于,所述方法还包括:根据所述目标用户的基本属性信息,生成所述目标用户的dense特征。5.根据权利要求4所述的文本搜索意图识别方法,其特征在于,所述将所述文本向量化编码特征和所述用户向量化编码特征输入到预先练好的意图识别模型中,输出所述搜索文本的意图识别结果包括:根据所述文本向量化编码特征和所述用户向量化编码特征,生成交叉向量编码特征,其中,所述交叉向量编码特征为文本向量化编码特征和所述用户向量化编码特征的内积;将所述...

【专利技术属性】
技术研发人员:李全祚赵涛方德文朱华炜高亚迪曲亮朱安泰
申请(专利权)人:天九共享网络科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1