相似度模型的训练方法、设备、存储介质及程序产品技术

技术编号:40710048 阅读:18 留言:0更新日期:2024-03-22 11:11
本申请实施例公开了相似度模型的训练方法、设备、存储介质及程序产品。该方法包括:获取训练样本;调用相似度模型,将训练样本中的搜索请求和搜索结果进行拼接,对拼接后的文本信息进行特征提取,得到全局特征信息;对搜索请求进行特征提取,得到搜索请求在至少两个维度下的第一局部特征信息,并对搜索结果进行特征提取,得到搜索结果在至少两个维度下的第二局部特征信息;将第一局部特征信息和第二局部特征信息进行特征融合,得到融合后的特征信息;按照减小全局特征信息和融合后的特征信息的差异的方向,对相似度模型进行训练,得到训练后的相似度模型。采用本申请实施例能够在不影响相似度的预测速度的情况下,提升预测得到的相似度的准确性。

【技术实现步骤摘要】

本申请涉及计算机应用,尤其涉及相似度模型的训练方法、设备、存储介质及程序产品


技术介绍

1、随着计算机技术的普及,搜索引擎在日常生活中扮演着查询疑问和检索信息的重要手段。搜索引擎可以通过相似度模型对搜索请求(即问题(query))和该搜索请求的搜索结果(即文档(doc))的相关性进行约束,以提高搜索的体验。传统的相似度模型采用端到端的架构进行设计,具体的,相似度模型在获取到搜索请求和搜索结果之后,对搜索请求和搜索结果进行拼接,得到拼接后的文本信息,然后对拼接后的文本信息进行特征提取,得到拼接后的文本信息的全局特征信息,进而基于该全局特征信息预测搜索请求和搜索结果的相似度。但是传统的相似度模型提取的全局特征信息简单、粗暴,忽略了很多细粒度的知识和表征,导致通过传统的相似度模型预测得到的相似度不够准确。


技术实现思路

1、本申请实施例提供了相似度模型的训练方法、设备、存储介质及程序产品,能够在不影响相似度的预测速度的情况下,有效提升预测得到的相似度的准确性。

2、一方面,本申请实施例提供一种相似度模本文档来自技高网...

【技术保护点】

1.一种相似度模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述训练样本还包括相似度标签,所述相似度标签用于指示所述搜索请求和所述搜索结果的相似度;所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述搜索请求进行特征提取,得到所述搜索请求在至少两个维度下的第一局部特征信息,并对所述搜索结果进行特征提取,得到所述搜索结果在所述至少两个维度下的第二局部特征信息,包括:

<...

【技术特征摘要】

1.一种相似度模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述训练样本还包括相似度标签,所述相似度标签用于指示所述搜索请求和所述搜索结果的相似度;所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述搜索请求进行特征提取,得到所述搜索请求在至少两个维度下的第一局部特征信息,并对所述搜索结果进行特征提取,得到所述搜索结果在所述至少两个维度下的第二局部特征信息,包括:

6.根据权利要求1-5任一项所述的方法,其特征在于,在任一维度下的第一...

【专利技术属性】
技术研发人员:王逸凡
申请(专利权)人:小红书科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1