【技术实现步骤摘要】
一种数据处理方法、装置、电子设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、装置、电子设备及存储介质。
技术介绍
[0002]随着互联网技术的快速发展,搜索引擎在人们的工作、学习以及生活中的应用越来越广泛。目前,搜索引擎的搜索结果的推荐方法通常是根据搜索结果的内容热度来对搜索结果进行从高到低的排序展示。例如某个搜索结果的搜索频率或点击频率或浏览频率越高,该搜索结果也会展示在越前面。
[0003]但是,对于企业中的搜索引擎而言,企业中的员工利用搜索引擎对信息的检索大多数是涉及业务场景信息检索,不同员工对不同搜索结果的需求程度和搜索倾向性通常是不一样的,若将上述搜索结果的推荐方法应用在企业中的搜索引擎,内容热度较高的搜索结果往往是排在前面的,而可能会导致员工所需的搜索结果排在后面,因此,如何提高企业中搜索引擎的推荐效率成为当前搜索引擎的研究热点。
技术实现思路
[0004]本申请实施例提供了一种数据处理方法、装置、电子设备及存储介质,可以结合对搜索词的语义理解以及用户的用户 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取用户输入的搜索词,并确定所述搜索词对应的候选扩展词集,所述候选扩展词集中包括一个或多个候选扩展词;根据所述搜索词的第一词性信息和所述候选扩展词集中各个候选扩展词的第二词性信息,从所述各个候选扩展词中确定一个或多个目标扩展词;获取所述用户的用户特征,并根据所述用户的用户特征确定所述搜索词与所述一个或多个目标扩展词中各个目标扩展词之间的关联度;获取与所述搜索词和所述各个目标扩展词对应的多个搜索结果,并确定所述多个搜索结果中各个搜索结果的调整系数;根据所述关联度和所述调整系数确定所述各个搜索结果的搜索得分,以及根据所述各个搜索结果的搜索得分展示所述各个搜索结果。2.根据权利要求1所述的方法,其特征在于,所述确定所述搜索词对应的候选扩展词集,包括:根据预设扩展词算法确定所述搜索词对应的一个或多个第一扩展词;确定所述搜索词对应的第一词向量,以及所述一个或多个第一扩展词中各个第一扩展词分别对应的第二词向量;根据所述第一词向量和所述各个第一扩展词分别对应的第二词向量,利用第一相似度算法确定所述搜索词与所述各个第一扩展词之间的第一相似度;确定所述第一相似度大于或等于预设相似阈值的第一扩展词为所述搜索词对应的候选扩展词。3.根据权利要求1所述的方法,其特征在于,所述根据所述搜索词的第一词性信息和所述一个或多个候选扩展词中各个候选扩展词的第二词性信息,从所述各个候选扩展词中确定一个或多个目标扩展词,包括:根据预设词性算法模型对所述搜索词和所述各个候选扩展词进行词性分析,得到所述搜索词对应的第一词性信息,以及所述各个候选扩展词分别对应的第二词性信息,其中,所述第一词性信息包括所述搜索词的第一词性以及所述搜索词的词性为第一词性的第一概率,所述第二词性信息包括所述各个候选扩展词的第二词性以及所述各个候选扩展词的词性为第二词性的第二概率;从所述各个候选扩展词中确定所述第一词性与所述第二词性相同的一个或多个第二扩展词;当确定所述搜索词对应的第一概率与所述一个或多个第二扩展词中的一个第二扩展词对应的第二概率的乘积大于预设阈值时,确定所述一个第二扩展词为所述搜索词对应的目标扩展词。4.根据权利要求1或3所述的方法,其特征在于,所述目标扩展词包括第一目标扩展词;所述根据所述用户的用户特征确定所述搜索词与所述一个或多个目标扩展词中各个目标扩展词之间的关联度,包括:根据所述搜索词和所述第一目标扩展词确定多个参考用户,其中,所述多个参考用户包括第一用户、第二用户、第三用户,所述第一用户包括搜索过所述搜索词和所述第一目标扩展词的用户,所述第二用户包括搜索过所述搜索词的用户,所述第三用户包括搜索过所
述第一目标扩展词的用户;确定所述多个参考用户中各个参考用户的用户特征;根据所述用户的用户特征和所述各个参考用户的用户特征,确定所述搜索词与所述第一目标扩展词之间的关联度。5.根据权利要求4所述的方法,其特征在于,所述根据...
【专利技术属性】
技术研发人员:张玉君,钱勇,罗晓生,杜晓东,
申请(专利权)人:深圳平安智汇企业信息管理有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。