【技术实现步骤摘要】
一种数据处理方法、装置、电子设备及存储介质
[0001]本公开涉及计算机
,尤其涉及一种数据处理方法、装置、电子设备及存储介质。
技术介绍
[0002]目前,可以基于用户在搜索系统中输入的搜索词,为用户确定并返回与该搜索词相关的数据。例如,“传奇”这个搜索词,在某个应用场景下,绝大多数用户想搜索的是游戏传奇,那么在该场景下搜索“传奇”时,搜索系统无论在召回还是在排序阶段都更倾向于返回游戏传奇的内容。
[0003]显然,这种只关注主流用户搜索需求的行为,会导致其他用户的搜索需求无法得到满足,进而导致其他用户的搜索体验非常差。例如,对于那些想搜索歌曲传奇的用户,搜索体验就会非常差。
技术实现思路
[0004]本公开提供一种数据处理方法、装置、电子设备及存储介质,解决了现有技术中可能无法满足用户的搜索需求,进而导致用户搜索体验差的技术问题。
[0005]本公开实施例的技术方案如下:
[0006]根据本公开实施例的第一方面,提供一种数据处理方法。该方法可以包括:获取第一搜索关键字;基于该 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,应用于电子设备,其特征在于,包括:获取第一搜索关键字;基于所述第一搜索关键字,从目标集合中确定至少两种类型的搜索结果,所述目标集合为第一样本集合和第二样本集合的并集,所述第一样本集合对应的历史搜索词包括所述第一搜索关键字,所述第二样本集合对应的历史搜索词包括所述第一搜索关键字与第二搜索关键字,并且所述第二样本集合与所述第一样本集合之间的搜索时间差小于时间阈值,所述第一搜索关键字与所述第二搜索关键字包括有用于表征相同语义的关键字,所述第一样本集合用于确定所述第一搜索关键字对应的至少一种类型的搜索结果。2.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:获取目标历史样本集合,所述目标历史样本集合包括历史搜索词以及与所述历史搜索词对应的满足预设条件的搜索结果;从所述目标历史样本集合中确定所述第一样本集合和所述第二样本集合;将所述第一样本集合和所述第二样本集合合并为所述目标集合。3.根据权利要求2所述的数据处理方法,其特征在于,所述预设条件包括对应的搜索结果的满意值大于第一阈值,且对应的搜索结果的被展示次数大于第二阈值,所述获取目标历史样本集合,包括:获取历史时间段内的历史搜索词、与所述历史搜索词对应的搜索结果,以及所述搜索结果的用户行为数据;对所述搜索结果的用户行为数据进行聚合,得到多个样本集合,每个样本集合至少包括所述历史搜索词、与所述历史搜索词对应的一个搜索结果,以及所述一个搜索结果对应的聚合后的用户行为数据;确定每个样本集合对应的搜索结果的用户满意值;将所述多个样本集合中对应的搜索结果的用户满意值大于所述第一阈值,且对应的搜索结果的被展示次数大于所述第二阈值的样本集合确定为所述目标历史样本集合。4.根据权利要求3所述的数据处理方法,其特征在于,所述确定每个样本集合对应的搜索结果的用户满意值,包括:将目标样本集合对应的搜索结果的用户满意率与所述目标样本集合对应的搜索结果的用户满意置信度的乘积,确定为所述目标样本集合对应的搜索结果的用户满意...
【专利技术属性】
技术研发人员:张志伟,王希爱,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。