一种提供搜索联想词的方法和装置制造方法及图纸

技术编号:31010250 阅读:43 留言:0更新日期:2021-11-30 00:07
本发明专利技术公开了一种提供搜索联想词的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取用户输入的搜索关键词,使用搜索关键词在设定的语料库中进行检索,得到用于联想搜索关键词的候选文本集;其中,语料库包括语料文本和为语料文本统计出的多个评价参数的参数值;根据参数值,为候选文本集的候选文本计算多个评价参数的基准评价值,将多个基准评价值加权求和,得到候选文本的综合评价值;将候选文本按照综合评价值进行排序,根据排序结果选取目标候选文本作为搜索关键词的联想词。该方法使用多个评价参数对候选文本进行综合评价,进而选取综合评价高的候选文本作为联想词,实现了更细粒度的输入联想,使得联想结果更加准确。联想结果更加准确。联想结果更加准确。

【技术实现步骤摘要】
一种提供搜索联想词的方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种提供搜索联想词的方法和装置。

技术介绍

[0002]随着互联网的蓬勃发展,越来越多的服务通过互联网提供和消费,在线客服也迅速发展起来。为了提升用户的输入效率,同时也起到一定的引导作用,在线客服窗口一般会提供输入联想机制,该机制可以在用户输入部分关键字时,自动联想出用户可能需要输入的咨询内容,用户点击即可完成完整咨询内容的输入。
[0003]现有的在线客服在根据用户输入的部分关键字联想咨询内容时,通常基于过去一段时间的用户咨询记录,挖掘出用户咨询的高频问题,使用这些高频问题构建语料库,然后通过语料库匹配用户输入的关键字,将匹配出的高频问题按照频率高低排序,频率越高则认为是最可能被再次咨询的问题,并推送给用户。
[0004]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0005]输入联想的粒度较粗,联想结果准确度低,无法满足实际需求。

技术实现思路

[0006]有鉴于此,本专利技术实施例提供一种提供搜索联想词的方法和装置,基于搜索关键词确定候选文本集后,使用多个评价参数对候选文本进行综合评价,进而选取综合评价高的候选文本作为联想词,实现了更细粒度的输入联想,使得联想结果更加准确,更加贴近用户想输入的内容。
[0007]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种提供搜索联想词的方法。
[0008]本专利技术实施例的一种提供搜索联想词的方法,包括:获取用户输入的搜索关键词,使用所述搜索关键词在设定的语料库中进行检索,得到用于联想所述搜索关键词的候选文本集;其中,所述语料库包括语料文本和为所述语料文本统计出的多个评价参数的参数值;根据所述参数值,为所述候选文本集的候选文本计算所述多个评价参数的基准评价值,将多个所述基准评价值加权求和,得到所述候选文本的综合评价值;将所述候选文本按照所述综合评价值进行排序,根据排序结果选取目标候选文本作为所述搜索关键词的联想词。
[0009]可选地,所述评价参数为下列任意多个的组合:文本出现频次、文本生成时间、物品品类、供应方标识、搜索入口;所述方法还包括:根据历史搜索记录,计算所述语料文本的文本出现频次;根据所述历史搜索记录,确定所述语料文本的文本生成时间、所述语料文本所对应物品的物品品类和供应方标识、以及搜索入口。
[0010]可选地,根据所述参数值,为所述候选文本集的候选文本计算所述文本出现频次的基准评价值,包括:根据所述候选文本集中候选文本的文本出现频次,确定最大文本出现频次;根据所述最大文本出现频次,对所述候选文本的文本出现频次进行归一化处理,得到所述候选文本的文本出现频次的基准评价值。
[0011]可选地,根据所述参数值,为所述候选文本集的候选文本计算所述文本生成时间的基准评价值,包括:根据所述候选文本集中候选文本的文本生成时间,确定最大文本生成时间和最小文本生成时间;根据所述最大文本生成时间和所述最小文本生成时间,对所述候选文本的文本生成时间进行归一化处理,得到所述候选文本的文本生成时间的基准评价值。
[0012]可选地,所述物品品类包括多级分类;根据所述参数值,为所述候选文本集的候选文本计算所述物品品类的基准评价值,包括:将所述搜索关键词所对应物品的物品品类与所述候选文本集中候选文本对应的物品品类进行比较,得到隶属相同分类的分类级别;将为所述分类级别设定的评分参考值作为所述候选文本的物品品类的基准评价值;其中,所述分类级别越高,所述评分参考值越大。
[0013]可选地,根据所述参数值,为所述候选文本集的候选文本计算所述供应方标识的基准评价值,包括:将所述搜索关键词所对应物品的供应方标识与所述候选文本集中候选文本对应的供应方标识进行比较;如果供应方标识相同,则所述候选文本的供应方标识的基准评价值为设定的第一数值;如果供应方标识不同,则所述候选文本的供应方标识的基准评价值为设定的第二数值。
[0014]可选地,根据所述参数值,为所述候选文本集的候选文本计算所述搜索入口的基准评价值,包括:将用户输入所述搜索关键词的搜索入口与所述候选文本集中候选文本对应的搜索入口进行比较;如果搜索入口相同,则所述候选文本的搜索入口的基准评价值为设定的第一数值;如果搜索入口不同,则所述候选文本的搜索入口的基准评价值为设定的第二数值。
[0015]为实现上述目的,根据本专利技术实施例的另一方面,提供了一种提供搜索联想词的装置。
[0016]本专利技术实施例的一种提供搜索联想词的装置,包括:获取检索模块,用于获取用户输入的搜索关键词,使用所述搜索关键词在设定的语料库中进行检索,得到用于联想所述搜索关键词的候选文本集;其中,所述语料库包括语料文本和为所述语料文本统计出的多个评价参数的参数值;计算求和模块,用于根据所述参数值,为所述候选文本集的候选文本计算所述多个评价参数的基准评价值,将多个所述基准评价值加权求和,得到所述候选文本的综合评价值;排序选取模块,用于将所述候选文本按照所述综合评价值进行排序,根据排序结果选取目标候选文本作为所述搜索关键词的联想词。
[0017]可选地,所述评价参数为下列任意多个的组合:文本出现频次、文本生成时间、物品品类、供应方标识、搜索入口;所述装置还包括:语料库构建模块,用于根据历史搜索记录,计算所述语料文本的文本出现频次;以及根据所述历史搜索记录,确定所述语料文本的文本生成时间、所述语料文本所对应物品的物品品类和供应方标识、以及搜索入口。
[0018]可选地,所述计算求和模块,还用于根据所述候选文本集中候选文本的文本出现频次,确定最大文本出现频次;以及根据所述最大文本出现频次,对所述候选文本的文本出现频次进行归一化处理,得到所述候选文本的文本出现频次的基准评价值。
[0019]可选地,所述计算求和模块,还用于根据所述候选文本集中候选文本的文本生成时间,确定最大文本生成时间和最小文本生成时间;以及根据所述最大文本生成时间和所述最小文本生成时间,对所述候选文本的文本生成时间进行归一化处理,得到所述候选文
本的文本生成时间的基准评价值。
[0020]可选地,所述物品品类包括多级分类;所述计算求和模块,还用于将所述搜索关键词所对应物品的物品品类与所述候选文本集中候选文本对应的物品品类进行比较,得到隶属相同分类的分类级别;以及将为所述分类级别设定的评分参考值作为所述候选文本的物品品类的基准评价值;其中,所述分类级别越高,所述评分参考值越大。
[0021]可选地,所述计算求和模块,还用于将所述搜索关键词所对应物品的供应方标识与所述候选文本集中候选文本对应的供应方标识进行比较;如果供应方标识相同,则所述候选文本的供应方标识的基准评价值为设定的第一数值;以及如果供应方标识不同,则所述候选文本的供应方标识的基准评价值为设定的第二数值。
[0022]可选地,所述计算求和模块,还用于将用户输入所述搜索关键词的搜索入口与所述候选文本集中候选文本对应的搜索入口进行比较;如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提供搜索联想词的方法,其特征在于,包括:获取用户输入的搜索关键词,使用所述搜索关键词在设定的语料库中进行检索,得到用于联想所述搜索关键词的候选文本集;其中,所述语料库包括语料文本和为所述语料文本统计出的多个评价参数的参数值;根据所述参数值,为所述候选文本集的候选文本计算所述多个评价参数的基准评价值,将多个所述基准评价值加权求和,得到所述候选文本的综合评价值;将所述候选文本按照所述综合评价值进行排序,根据排序结果选取目标候选文本作为所述搜索关键词的联想词。2.根据权利要求1所述的方法,其特征在于,所述评价参数为下列任意多个的组合:文本出现频次、文本生成时间、物品品类、供应方标识、搜索入口;所述方法还包括:根据历史搜索记录,计算所述语料文本的文本出现频次;根据所述历史搜索记录,确定所述语料文本的文本生成时间、所述语料文本所对应物品的物品品类和供应方标识、以及搜索入口。3.根据权利要求2所述的方法,其特征在于,根据所述参数值,为所述候选文本集的候选文本计算所述文本出现频次的基准评价值,包括:根据所述候选文本集中候选文本的文本出现频次,确定最大文本出现频次;根据所述最大文本出现频次,对所述候选文本的文本出现频次进行归一化处理,得到所述候选文本的文本出现频次的基准评价值。4.根据权利要求2所述的方法,其特征在于,根据所述参数值,为所述候选文本集的候选文本计算所述文本生成时间的基准评价值,包括:根据所述候选文本集中候选文本的文本生成时间,确定最大文本生成时间和最小文本生成时间;根据所述最大文本生成时间和所述最小文本生成时间,对所述候选文本的文本生成时间进行归一化处理,得到所述候选文本的文本生成时间的基准评价值。5.根据权利要求2所述的方法,其特征在于,所述物品品类包括多级分类;根据所述参数值,为所述候选文本集的候选文本计算所述物品品类的基准评价值,包括:将所述搜索关键词所对应物品的物品品类与所述候选文本集中候选文本对应的物品品类进行比较,得到隶属相同分类的分类级别;将为所述分类级别设定的评分参考值作为所述候选文本的物品品类的基准评价值;其中,所述分类级别越高,所述评分参考值越大。6.根据权利要求2所述的方法,其特征在于,根据所述参数值...

【专利技术属性】
技术研发人员:何刚杨森
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1