【技术实现步骤摘要】
即时通讯群组的搜索方法、装置、电子设备和存储介质
[0001]本公开涉及人工智能领域,尤其涉及深度学习领域、自然语言处理领域和智能搜索领域,特别的涉及一种即时通讯群组的搜索方法、装置、电子设备和存储介质。
技术介绍
[0002]即时通讯应用软件,是一种面向终端用户的网络沟通工具,用户可以通过安装即时通讯客户端或网页端进行两人或多人之间的实时沟通。在需要进行多人沟通的场景下,可使用即时通讯软件的群组功能。
[0003]随着即时通讯软件的使用,用户可能创建众多的群组来进行沟通,当需要使用某特定群组进行沟通时,通常是利用关键词检索并快速切换到跟自己当前工作相关的群组。但是,短时间内在大量群组描述类似的情况下,用户往往无法找到精准的描述定位自己的群组,导致搜索群组的效率低下。
技术实现思路
[0004]本公开提供了一种即时通讯群组的搜索方法、装置、电子设备以及存储介质,可应用于即时通讯软件的群组搜索场景。
[0005]根据本公开的第一方面,提供了一种即时通讯群组的搜索方法,包括:
[0006]获取搜索请求中的搜索关键词,并根据所述搜索关键词进行群组搜索,获得搜索到的多个目标群组;
[0007]获取每个所述目标群组的群组数据;
[0008]根据每个所述目标群组的群组数据和预设的群组点击率预估模型,获得每个所述目标群组的点击率预测得分;
[0009]根据每个所述目标群组的点击率预测得分,对所述多个目标群组进行排序,并根据排序结果对所述多个目标群组进行展示。
...
【技术保护点】
【技术特征摘要】
1.一种即时通讯群组的搜索方法,包括:获取搜索请求中的搜索关键词,并根据所述搜索关键词进行群组搜索,获得搜索到的多个目标群组;获取每个所述目标群组的群组数据;根据每个所述目标群组的群组数据和预设的群组点击率预估模型,获得每个所述目标群组的点击率预测得分;根据每个所述目标群组的点击率预测得分,对所述多个目标群组进行排序,并根据排序结果对所述多个目标群组进行展示。2.根据权利要求1所述的方法,其中,所述群组数据包括下述至少一项:所述搜索请求的发起帐号与所述目标群组之间的交互数据;所述搜索关键词与所述目标群组名称之间的词面相关性得分;所述搜索关键词命中的所述目标群组的名称文本信息;所述目标群组的属性信息;其中,所述属性信息包括下述至少一项:群组创立时间信息、群组上次有人发言的时间信息、群组成员数量、群组内与所述搜索请求的发起帐号同部门在群组总人数中所占的比重、所述搜索关键词命中群组名称长度在群组名称总长度中所占的比重、所述搜索关键词命中群组内成员个数在群组成员总个数中所占的比重。3.根据权利要求2所述的方法,其中,获取每个所述目标群组的所述搜索关键词与所述目标群组名称之间的词面相关性得分,包括:基于字粒度生成所述搜索关键词的第一向量表示和所述目标群组的名称的第二向量表示;对于每个所述目标群组,根据所述第一向量表示和所述第二向量表示,计算所述搜索关键词与所述目标群组的名称之间的相似度;根据所述相似度,确定所述搜索关键词与所述目标群组名称之间的词面相关性得分。4.根据权利要求1所述的方法,其中,所述群组点击率预估模型包括FM层、Deep层、注意力层、拼接层和输出层;其中,所述FM层用于对所述群组数据进行特征提取,以得到第一特征向量;所述Deep层用于对所述群组数据之中所述词面相关性得分、所述属性信息进行特征提取,得到第二特征向量;所述注意力层用于基于注意力机制对所述群组数据之中所述词面相关性得分、所述属性信息进行特征提取,得到第三特征向量;所述拼接层用于将所述第一特征向量、所述第二特征向量和所述第三特征向量进行拼接处理;所述输出层用于对所述拼接层输出的拼接特征向量进行预测打分,以输出群组的点击率预测得分。5.根据权利要求1所述的方法,在根据每个所述目标群组的群组数据和预设的群组点击率预估模型,获得每个所述目标群组的点击率预测得分之前,所述方法还包括:对每个所述目标群组的群组数据之中的数值类数据进行Min-Max归一化处理;其中,所述Min-Max的公式表示如下:其中,normalized_score
Q
为群组数据之中的数值类数据的归一化分数;min
Q
为所述数值类数据所在的群组数据中的最小值,max
Q
为所述数值类数据所在的群组数据中的最大
值,x为所述数值类数据。6.一种即时通讯群组的搜索装置,包括:搜索模块,用于获取搜索请求中的搜索关键词,并根据所述搜索关键词进行群组搜索,获得搜索到的多个目标群组;获取模块,用于获取每个所述目标群组的群组数据;预测模块,用于根据每个所述目标群组的群组数据和预设的群组点击率预...
【专利技术属性】
技术研发人员:谢楚曦,李雅楠,何伯磊,刘准,和为,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。