词条获取方法、装置及电子设备制造方法及图纸

技术编号:36108173 阅读:14 留言:0更新日期:2022-12-28 14:09
本申请公开了一种词条获取方法、装置及电子设备。方法包括:获取目标用户的待搜索前缀字符;从预设词条库中确定对应待搜索前缀字符的多个初选词条;从预设评分库中获取多个初选词条各自的词条评分,预设评分库包括每个词条的词条评分,词条的词条评分基于词条对应的关注度评分、相关性评分以及偏好评分获得;根据多个初选词条各自的词条评分,在多个初选词条中确定目标词条。本申请中,由于词条的词条评分基于词条对应的关注度评分、相关性评分以及偏好评分获得,词条评分可以准确的反应词条与目标用户的需求的匹配程度,使得根据词条评分确定的目标词条的准确率较高,目标词条与目标用户的需求更加匹配。用户的需求更加匹配。用户的需求更加匹配。

【技术实现步骤摘要】
词条获取方法、装置及电子设备


[0001]本申请涉及人工智能
,更具体地,涉及一种词条获取方法、装置及电子设备。

技术介绍

[0002]搜索字段自动补全,也叫搜索下拉推荐。用户可以在电子设备中输入需求词条的部分字段,电子设备在预存的多个词条中确定与输入的字段匹配的多个词条,然后将确定出的多个词条按照分值由高到低排序,最后选择排名靠前的词条作为输出的推荐词条。
[0003]但是,采用该词条获取方法,得到的推荐词条的准确率较低,导致推荐词条难以与用户的需求相匹配。

技术实现思路

[0004]有鉴于此,本申请实施例提出了一种词条获取方法、装置及电子设备。
[0005]第一方面,本申请实施例提供了一种词条获取方法,方法包括:获取目标用户输入的字符,作为待搜索前缀字符;从预设词条库中确定对应所述待搜索前缀字符的多个初选词条,所述预设词条库包括多个前缀字符以及所述多个前缀字符各自对应的词条;从预设评分库中获取所述多个初选词条各自的词条评分,所述预设评分库包括每个所述词条的词条评分,所述词条的词条评分基于所述词条对应的关注度评分、相关性评分以及偏好评分获得,所述关注度评分表征所述目标用户对所述词条的关注程度,所述相关性评分表征所述词条与所述预设词条库中其他词条之间的相关性,所述偏好评分表征所述目标用户对所述词条的偏好程度;根据所述多个初选词条各自的词条评分,在所述多个初选词条中确定目标词条。
[0006]第二方面,本申请实施例提供了一种词条获取装置,装置包括:字符获取模块,用于获取目标用户输入的字符,作为待搜索前缀字符;词条确定模块,用于从预设词条库中确定对应所述待搜索前缀字符的多个初选词条,所述预设词条库包括多个前缀字符以及所述多个前缀字符各自对应的词条;评分确定模块,用于从预设评分库中获取所述多个初选词条各自的词条评分,所述预设评分库包括每个所述词条的词条评分,所述词条的词条评分基于所述词条对应的关注度评分、相关性评分以及偏好评分获得,所述关注度评分表征所述目标用户对所述词条的关注程度,所述相关性评分表征所述词条与所述预设词条库中其他词条之间的相关性,所述偏好评分表征所述目标用户对所述词条的偏好程度;目标词条获得模块,用于根据所述多个初选词条各自的词条评分,在所述多个初选词条中确定目标词条。
[0007]可选地,装置还包括词条库获取模块,用于获取多个历史词条以及多个更新词条,所述多个历史词条是所述目标用户搜索过的词条,每个所述更新词条包括所述多个历史词条中未出现过的新词和/或呈趋势性变化的趋势词;根据所述多个历史词条各自的转化率和点击率,从所述多个历史词条中筛选出第一词条;根据所述多个更新词条各自的点击率
和召回率,从所述多个更新词条中确定出第二词条;根据所述第一词条和所述第二词条,得到所述预设词条库。
[0008]可选地,词条库获取模块,还用于将所述第一词条和所述第二词条汇总,得到词条集;获取所述词条集中的每个词条的前缀;将所述词条集合中的每个词条以及所述词条集合中的每个词条对应的前缀作为一个字符对;根据所述词条集合中各个词条对应的字符对,得到所述预设词条库。
[0009]可选地,装置还包括评分库获取模块,用于获取对应每个所述词条的字符对,每个所述字符对基于所述预设词条库中每个词条以及所述预设词条库中每个词条的前缀获得;对每个所述字符对进行特征提取,得到对应每个字符对的统计特征、文本特征以及编辑距离;基于每个所述字符对的统计特征、文本特征以及编辑距离获取,得到对应每个所述字符对的关注度评分以及相关性评分;根据所述目标用户对每个所述字符对的偏好程度,确定每个所述字符对的偏好评分;根据每个所述字符对的关注度评分的权重、相关性评分的权重以及偏好评分的权重,对每个所述字符对的关注度评分、相关性评分以及偏好评分进行加权求和,得到每个所述字符对对应的词条的词条评分;根据所述预设词条库中每个词条对应的词条评分,得到所述预设评分库。
[0010]可选地,评分库获取模块,还用于将每个所述字符对的统计特征、文本特征以及编辑距离输入关注度评分模型,得到对应每个所述字符对的关注度评分;将每个所述数字符对的统计特征、文本特征以及编辑距离输入相关性评分模型,得到对应每个字符对的相关性评分。
[0011]可选地,评分库获取模块,还用于记录所述目标用户的搜索词条以及偏好词条;根据记录的搜索词条以及偏好词条对每个所述字符对的关注度评分的权重、相关性评分的权重以及偏好评分的权重进行调整;根据调整后的每个所述字符对的关注度评分的权重、相关性评分的权重以及偏好评分的权重,对每个所述字符对的关注度评分、相关性评分以及偏好评分进行加权求和,得到每个字符对对应的词条的更新词条评分;根据所述预设词条库中每个所述词条对应的更新词条评分,得到更新后的预设评分库。
[0012]可选地,目标词条确定模块,还用于在所述多个初选词条中确定词条评分较高的M个词条作为第三词条,M为大于1的整数;在所述第三词条中确定出语义相匹配的关联词条;根据关联词条的词条评分,在所述关联词条中确定出第四词条;将所述第三词条中除所述关联词条以外的词条以及所述第四词条作为目标词条。
[0013]可选地,字符获取模块,还用于通过搜索界面中的搜索控件获取目标用户输入的待搜索前缀字符;装置还包括:推荐模块,用于在所述目标词条中确定出词条评分较高的N个词条作为第五词条,N为大于1的整数;获取对应所述第五词条的推荐对象;在所述搜索界面的显示区输出所述推荐对象。
[0014]第三方面,本申请实施例提供了一种电子设备,包括处理器以及存储器;一个或多个程序被存储在存储器中并被配置为由处理器执行以实现上述的方法。
[0015]第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有程序代码,其中,在程序代码被处理器运行时执行上述的方法。
[0016]第五方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子
设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述的方法。
[0017]本申请实施例提供的一种词条获取方法、装置、电子设备及存储介质,从预设词条库中确定对应待搜索前缀字符的多个初选词条,并根据多个初选词条各自的词条评分,在多个初选词条中确定目标词条,由于词条的词条评分基于词条对应的关注度评分、相关性评分以及偏好评分获得,词条评分可以准确的反应词条与目标用户的需求的匹配程度,使得根据词条评分确定的目标词条的准确率较高,目标词条与目标用户的需求更加匹配。
附图说明
[0018]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1是根据本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种词条获取方法,其特征在于,所述方法包括:获取目标用户输入的字符,作为待搜索前缀字符;从预设词条库中确定对应所述待搜索前缀字符的多个初选词条,所述预设词条库包括多个前缀字符以及所述多个前缀字符各自对应的词条;从预设评分库中获取所述多个初选词条各自的词条评分,所述预设评分库包括每个所述词条的词条评分,所述词条的词条评分基于所述词条对应的关注度评分、相关性评分以及偏好评分获得,所述关注度评分表征所述目标用户对所述词条的关注程度,所述相关性评分表征所述词条与所述预设词条库中其他词条之间的相关性,所述偏好评分表征所述目标用户对所述词条的偏好程度;根据所述多个初选词条各自的词条评分,在所述多个初选词条中确定目标词条。2.根据权利要求1所述的方法,其特征在于,所述预设词条库的获取方法包括:获取多个历史词条以及多个更新词条,所述多个历史词条是所述目标用户搜索过的词条,每个所述更新词条包括所述多个历史词条中未出现过的新词和/或呈趋势性变化的趋势词;根据所述多个历史词条各自的转化率和点击率,从所述多个历史词条中筛选出第一词条;根据所述多个更新词条各自的点击率和召回率,从所述多个更新词条中确定出第二词条;根据所述第一词条和所述第二词条,得到所述预设词条库。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一词条和所述第二词条,得到所述预设词条库,包括:将所述第一词条和所述第二词条汇总,得到词条集;获取所述词条集中的每个词条的前缀;将所述词条集合中的每个词条以及所述词条集合中的每个词条对应的前缀作为一个字符对;根据所述词条集合中各个词条对应的字符对,得到所述预设词条库。4.根据权利要求1所述的方法,其特征在于,所述预设评分库的获取方法包括:获取对应每个所述词条的字符对,每个所述字符对基于所述预设词条库中每个词条以及所述预设词条库中每个词条的前缀获得;对每个所述字符对进行特征提取,得到对应每个字符对的统计特征、文本特征以及编辑距离;基于每个所述字符对的统计特征、文本特征以及编辑距离获取,得到对应每个所述字符对的关注度评分以及相关性评分;根据所述目标用户对每个所述字符对的偏好程度,确定每个所述字符对的偏好评分;根据每个所述字符对的关注度评分的权重、相关性评分的权重以及偏好评分的权重,对每个所述字符对的关注度评分、相关性评分以及偏好评分进行加权求和,得到每个所述字符对对应的词条的词条评分;根据所述预设词条库中每个词条对应的词条评分,得到所述预设评分库。5.根据权利要求4所述的方法,其特征在于,所述基于每个所述字符对的统计特征、文
本特征以及编辑距离获取,得到对应每个所述字符对的关注度评分以及相关性评分,包括:将每个所述字符对的统计特征、文本特征以及编辑距离输入关注度评分模型,得到对应每个所述字符对的关注度评分;将每个所述数字符对的统计特征、文本特征以及编辑距离输入相关性评分模型,得到对应...

【专利技术属性】
技术研发人员:徐进添
申请(专利权)人:广州欢聚时代信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1