一种数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32130579 阅读:13 留言:0更新日期:2022-01-29 19:28
本公开关于一种数据处理方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法包括:获取第一搜索关键字;基于该第一搜索关键字,从目标集合中确定至少两种类型的搜索结果,该目标集合为第一样本集合和第二样本集合的并集,该第一样本集合对应的历史搜索词包括该第一搜索关键字,该第二样本集合对应的历史搜索词包括该第一搜索关键字与第二搜索关键字,并且该第二样本集合与该第一样本集合之间的搜索时间差小于时间阈值。本公开中,电子设备可以方便、快捷地得到至少两种类型下的搜索结果,能够满足不同用户的搜索需求,提升用户的搜索体验。的搜索体验。的搜索体验。

【技术实现步骤摘要】
一种数据处理方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,尤其涉及一种数据处理方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,可以基于用户在搜索系统中输入的搜索词,为用户确定并返回与该搜索词相关的数据。例如,“传奇”这个搜索词,在某个应用场景下,绝大多数用户想搜索的是游戏传奇,那么在该场景下搜索“传奇”时,搜索系统无论在召回还是在排序阶段都更倾向于返回游戏传奇的内容。
[0003]显然,这种只关注主流用户搜索需求的行为,会导致其他用户的搜索需求无法得到满足,进而导致其他用户的搜索体验非常差。例如,对于那些想搜索歌曲传奇的用户,搜索体验就会非常差。

技术实现思路

[0004]本公开提供一种数据处理方法、装置、电子设备及存储介质,解决了现有技术中可能无法满足用户的搜索需求,进而导致用户搜索体验差的技术问题。
[0005]本公开实施例的技术方案如下:
[0006]根据本公开实施例的第一方面,提供一种数据处理方法。该方法可以包括:获取第一搜索关键字;基于该第一搜索关键字,从目标集合中确定至少两种类型的搜索结果,该目标集合为第一样本集合和第二样本集合的并集,该第一样本集合对应的历史搜索词包括该第一搜索关键字,该第二样本集合对应的历史搜索词包括该第一搜索关键字与第二搜索关键字,并且该第二样本集合与该第一样本集合之间的搜索时间差小于时间阈值,该第一搜索关键字与该第二搜索关键字包括有用于表征相同语义的关键字,该第一样本集合用于确定该第一搜索关键字对应的至少一种类型的搜索结果。
[0007]可选地,上述数据处理方法还包括:获取目标历史样本集合,该目标历史样本集合包括历史搜索词以及与该历史搜索词对应的满足预设条件的搜索结果;从该目标历史样本集合中确定该第一样本集合和该第二样本集合;将该第一样本集合和该第二样本集合合并为该目标集合。
[0008]可选地,上述预设条件包括对应的搜索结果的满意值大于第一阈值,且对应的搜索结果的被展示次数大于第二阈值,上述获取目标历史样本集合具体包括:获取预设时间段内的历史搜索词、与该历史搜索词对应的搜索结果,以及该搜索结果的用户行为数据;对该搜索结果的用户行为数据进行聚合,得到多个样本集合,每个样本集合至少包括该历史搜索词、与该历史搜索词对应的一个搜索结果,以及该一个搜索结果对应的聚合后的用户行为数据;确定每个样本集合对应的搜索结果的用户满意值;将该多个样本集合中对应的搜索结果的用户满意值大于该第一阈值,且对应的搜索结果的被展示次数大于该第二阈值的样本集合确定为该目标历史样本集合。
[0009]可选地,上述确定每个样本集合对应的搜索结果的用户满意值具体包括:将目标样本集合对应的搜索结果的用户满意率与该目标样本集合对应的搜索结果的用户满意置信度的乘积,确定为该目标样本集合对应的搜索结果的用户满意值,该目标样本集合为该多个样本集合中的一个。
[0010]可选地,上述数据处理方法还包括:根据该目标样本集合对应的搜索结果的用户满意度以及该目标样本集合对应的搜索结果的播放次数,确定该目标样本集合对应的搜索结果的用户满意率。
[0011]可选地,上述数据处理方法还包括:根据该目标样本集合对应的搜索结果对应的聚合后的每一种用户行为数据以及该每一种用户行为的权重,确定该目标样本集合对应的搜索结果的用户满意度。
[0012]可选地,上述数据处理方法还包括:根据该目标样本集合对应的搜索结果的播放次数,确定该目标样本集合对应的搜索结果的用户满意置信度。
[0013]根据本公开实施例的第二方面,提供一种数据处理装置。该装置可以包括:获取模块和确定模块;该获取模块,被配置为获取第一搜索关键字;该确定模块,被配置为基于该第一搜索关键字,从目标集合中确定至少两种类型的搜索结果,该目标集合为第一样本集合和第二样本集合的并集,该第一样本集合对应的历史搜索词包括该第一搜索关键字,该第二样本集合对应的历史搜索词包括该第一搜索关键字与第二搜索关键字,并且该第二样本集合与该第一样本集合之间的搜索时间差小于时间阈值,该第一搜索关键字与该第二搜索关键字包括有用于表征相同语义的关键字,该第一样本集合用于确定该第一搜索关键字对应的至少一种类型的搜索结果。
[0014]可选地,该数据处理装置还包括处理模块;该获取模块,还被配置为获取目标历史样本集合,该目标历史样本集合包括历史搜索词以及与该历史搜索词对应的满足预设条件的搜索结果;该确定模块,还被配置为从该目标历史样本集合中确定该第一样本集合和该第二样本集合;该处理模块,被配置为将该第一样本集合和该第二样本集合合并为该目标集合。
[0015]可选地,上述预设条件包括对应的搜索结果的满意值大于第一阈值,且对应的搜索结果的被展示次数大于第二阈值。该处理模块,具体被配置为对该搜索结果的用户行为数据进行聚合,得到多个样本集合,每个样本集合至少包括该历史搜索词、与该历史搜索词对应的一个搜索结果,以及该一个搜索结果对应的聚合后的用户行为数据;该确定模块,具体被配置为确定每个样本集合对应的搜索结果的用户满意值;该确定模块,具体还被配置为将该多个样本集合中对应的搜索结果的用户满意值大于该第一阈值,且对应的搜索结果的被展示次数大于该第二阈值的样本集合确定为该目标历史样本集合。
[0016]可选地,该确定模块,具体被配置为将目标样本集合对应的搜索结果的用户满意率与该目标样本集合对应的搜索结果的用户满意置信度的乘积,确定为该目标样本集合对应的搜索结果的用户满意值,该目标样本集合为该多个样本集合中的一个。
[0017]可选地,该确定模块,还被配置为根据该目标样本集合对应的搜索结果的用户满意度以及该目标样本集合对应的搜索结果的播放次数,确定该目标样本集合对应的搜索结果的用户满意率。
[0018]可选地,该确定模块,还被配置为根据该目标样本集合对应的搜索结果对应的聚
合后的每一种用户行为数据以及该每一种用户行为的权重,确定该目标样本集合对应的搜索结果的用户满意度。
[0019]可选地,该确定模块,还被配置为根据该目标样本集合对应的搜索结果的播放次数,确定该目标样本集合对应的搜索结果的用户满意置信度。
[0020]根据本公开实施例的第三方面,提供一种电子设备,可以包括:处理器和被配置为存储处理器可执行指令的存储器;其中,处理器被配置为执行所述指令,以实现上述第一方面中任一种可选地数据处理方法。
[0021]根据本公开实施例的第四方面,提供一种计算机可读存储介质,计算机可读存储介质上存储有指令,当该计算机可读存储介质中的指令由电子设备执行时,使得该电子设备能够执行上述第一方面中任一种可选地数据处理方法。
[0022]根据本公开实施例的第五方面,提供一种计算机程序产品,该计算机程序产品包括计算机指令,当该计算机指令在电子设备上运行时,使得该电子设备执行如第一方面中任一种可选地数据处理方法。
[0023]本公开的实施例提供的技术方案至少带来以下有益效果:
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,应用于电子设备,其特征在于,包括:获取第一搜索关键字;基于所述第一搜索关键字,从目标集合中确定至少两种类型的搜索结果,所述目标集合为第一样本集合和第二样本集合的并集,所述第一样本集合对应的历史搜索词包括所述第一搜索关键字,所述第二样本集合对应的历史搜索词包括所述第一搜索关键字与第二搜索关键字,并且所述第二样本集合与所述第一样本集合之间的搜索时间差小于时间阈值,所述第一搜索关键字与所述第二搜索关键字包括有用于表征相同语义的关键字,所述第一样本集合用于确定所述第一搜索关键字对应的至少一种类型的搜索结果。2.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:获取目标历史样本集合,所述目标历史样本集合包括历史搜索词以及与所述历史搜索词对应的满足预设条件的搜索结果;从所述目标历史样本集合中确定所述第一样本集合和所述第二样本集合;将所述第一样本集合和所述第二样本集合合并为所述目标集合。3.根据权利要求2所述的数据处理方法,其特征在于,所述预设条件包括对应的搜索结果的满意值大于第一阈值,且对应的搜索结果的被展示次数大于第二阈值,所述获取目标历史样本集合,包括:获取历史时间段内的历史搜索词、与所述历史搜索词对应的搜索结果,以及所述搜索结果的用户行为数据;对所述搜索结果的用户行为数据进行聚合,得到多个样本集合,每个样本集合至少包括所述历史搜索词、与所述历史搜索词对应的一个搜索结果,以及所述一个搜索结果对应的聚合后的用户行为数据;确定每个样本集合对应的搜索结果的用户满意值;将所述多个样本集合中对应的搜索结果的用户满意值大于所述第一阈值,且对应的搜索结果的被展示次数大于所述第二阈值的样本集合确定为所述目标历史样本集合。4.根据权利要求3所述的数据处理方法,其特征在于,所述确定每个样本集合对应的搜索结果的用户满意值,包括:将目标样本集合对应的搜索结果的用户满意率与所述目标样本集合对应的搜索结果的用户满意置信度的乘积,确定为所述目标样本集合对应的搜索结果的用户满意...

【专利技术属性】
技术研发人员:张志伟王希爱
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1