【技术实现步骤摘要】
一种确定搜索结果相关度的方法及装置
[0001]本说明书涉及数据处理
,尤其涉及一种确定搜索结果相关度的方法及装置。
技术介绍
[0002]作为获取信息的重要渠道,网络可供用户根据意愿搜索相应的新闻、商品、服务提供方等,以获取相关信息或执行业务。提供搜索服务的平台则需要基于用户搜索的查询文本,确定与该查询文本的搜索结果并推荐给用户。
[0003]平台推荐的搜索结果与用户的查询文本相关度越高,则推荐效果越好,而推荐效果取决于平台的搜索推荐算法。因此,平台确定的搜索结果与用户的查询文本的相关度可用于评估平台的搜索技术。
[0004]在现有技术中,通常是针对平台确定的每个搜索结果,通过离散的词袋模型分别将用户的查询文本与该搜索结果的结果文本中各个词进行编码得到各个词的向量,并基于查询文本与该结果文本两两词之间向量的相似度,确定该查询文本与该搜索结果整体的相关度。
[0005]但词袋模型对不同的词编码不同,现有技术中的相关度是根据词与词的编码之间是否一致得出的,现有技术对相关度的确定并不准确。
【技术保护点】
【技术特征摘要】
1.一种确定搜索结果相关度的方法,其特征在于,包括:确定查询文本及其对应的搜索结果的结果文本;将所述查询文本以及所述结果文本输入预先训练的相关度模型的编码模块,确定所述查询文本对应的第一特征以及所述结果文本对应的第二特征;通过所述相关度模型的交互模块,根据所述第一特征以及所述第二特征,确定所述查询文本与所述结果文本分别在预设的各计算方式下的相似性矩阵,并针对每个相似性矩阵,根据所述第一特征以及该相似性矩阵,确定所述查询文本与所述结果文本在该相似性矩阵对应的计算方式下的相关度特征;根据各相关度特征,通过所述相关度模型的融合模块,确定所述查询文本与所述搜索结果的相关度。2.如权利要求1所述的方法,其特征在于,所述计算方式包括:基于点积的计算方式、基于余弦距离的计算方式以及基于欧氏距离的计算方式中的至少两种。3.如权利要求1所述的方法,其特征在于,所述交互模块包括:第一模块以及第二模块;通过所述相关度模型的交互模块,根据所述第一特征以及所述第二特征,确定所述查询文本与所述结果文本分别在预设的各计算方式下的相似性矩阵,具体包括:通过所述第一模块,根据所述第一特征,确定第一中间特征,并根据将所述查询文本输入所述编码模块时对所述查询文本进行维度填充的位置,对所述第一中间特征中的部分特征添加掩码,得到第一融合特征;根据所述第一融合特征以及所述第二特征,通过所述第二模块,确定所述查询文本与所述结果文本分别在预设的各计算方式下的相似性矩阵。4.如权利要求3所述的方法,其特征在于,所述交互模块还包括第三模块;针对每个相似性矩阵,根据所述第一特征以及该相似性矩阵,确定所述查询文本与所述结果文本在该相似性矩阵对应的计算方式下的相关度特征,具体包括:针对每个相似性矩阵,将该相似性矩阵作为基于所述第一特征确定的所述第一融合特征的权重;将所述权重与所述第一融合特征输入所述第三模块,得到所述查询文本与所述结果文本在该相似性矩阵对应的计算方式下的相关度特征。5.如权利要求1所述的方法,其特征在于,预先训练所述相关度模型,具体包括:获取历史查询文本,并针对每个历史查询文本,确定该历史查询文本对应的历史搜索结果;确定该历史查询文本与所述历史搜索结果对应的多次历史搜索操作下用户的行为数据,以基于所述行为数据确定所述历史搜索结果对应的统计特征;根据预设的相关度判断条件与预训练的树模型中的至少一种以及所述统计特征,从所述历史搜索结果中确定用于组成训练样本的结果,并将该历史查询文本与确定出的结果的结果文本分别组合,确定各训练样本以及各训练样本分别对应的标签;分别将各训练样本输入待训练的所述相关度模型,得到所述相关度模型输出的各训练样本中该历史查询文本与搜索结果的相关度;根据基于各历史查询文本确定的各训练样本的标签与所述相关度模型输出的相关度之间的差异,对所述相关度模型进行训练。
6.如权利要求...
【专利技术属性】
技术研发人员:沈元,校娅,朱迪,许晓燕,汤彪,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。