搜索词处理方法、相关装置及存储介质制造方法及图纸

技术编号:40054551 阅读:21 留言:0更新日期:2024-01-16 21:43
本申请实施例涉及大语言模型技术领域,并提供一种搜索词处理方法、相关装置及存储介质,该方法包括:获取历史时段内用户搜索词发生切换的历史搜索交互数据,从历史搜索交互数据中获取切换搜索词集、各用户搜索词对应的用户点击标题,根据该切换搜索词集、用户点击标题得到纠错推理样本,基于纠错推理样本训练大语言模型,以得到目标纠错模型,在获取用户输入的初始搜索词后,获取与初始搜索词关联的切换搜索词集,基于预先训练的目标纠错模型对切换搜索词集中的各切换搜索词进行纠错处理,得到目标纠错搜索词,输出与目标纠错搜索词关联的点击标题。本方案能够提高目标纠错模型的纠错准确率、训练效率,以及降低目标纠错模型的训练成本。

【技术实现步骤摘要】

本申请实施例涉及大语言模型,尤其涉及一种搜索词处理方法、相关装置及存储介质


技术介绍

1、搜索query纠错是指在搜索引擎中,对用户输入的不规范或错误的查询词进行纠正,以提高搜索结果的准确性和相关性。通常采用基于词典的方法、基于语言模型的方法、基于机器学习和深度学习的方法。

2、在对现有技术的研究和实践过程中,本申请实施例的专利技术人发现,现有的query纠错方法存在几个问题:

3、1.针对新兴词汇或用户搜索行为的变化,现有的查询纠错技术方案(尤其是基于词典的方法、基于语言模型的方法)通常无法及时跟上,故一定程度上影响纠错效果。

4、2.基于机器学习或深度学习的方法,需要大量的训练样本或复杂的样本特征,所以开发周期长。


技术实现思路

1、本申请实施例提供了一种搜索词处理方法、相关装置及存储介质,能够提高纠错模型的纠错准确率、训练效率,以及降低纠错模型的训练成本。

2、第一方面,本申请实施例提供一种搜索词处理方法,该方法包括:

3、获取用户输入的初始本文档来自技高网...

【技术保护点】

1.一种搜索词处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预先训练的目标纠错模型对所述切换搜索词集中的各切换搜索词进行纠错处理之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述聚合所述切换搜索词集、各搜索词对应的用户点击标题,得到纠错推理文本,包括:

4.根据权利要求2或3所述的方法,其特征在于,所述发生切换是指用户搜索交互行为中连续的2个搜索词,且初始搜索词与纠错搜索词可能存在纠错关系;所述纠错关系包括以下项中的至少一项:

5.根据权利要求3所述的方法,其特征在于,所述根据所...

【技术特征摘要】

1.一种搜索词处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预先训练的目标纠错模型对所述切换搜索词集中的各切换搜索词进行纠错处理之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述聚合所述切换搜索词集、各搜索词对应的用户点击标题,得到纠错推理文本,包括:

4.根据权利要求2或3所述的方法,其特征在于,所述发生切换是指用户搜索交互行为中连续的2个搜索词,且初始搜索词与纠错搜索词可能存在纠错关系;所述纠错关系包括以下项中的至少一项:

5.根据权利要求3所述的方法,其特征在于,所述根据所述切换搜索词集、各搜索词对应的用户点击标题,构建提示文本集,包括:

6.根据权利要求3所述的方法,其特征在于,所述根据所述切换搜索词集、各搜索词对应的用户点击标题,构建...

【专利技术属性】
技术研发人员:易磊朱秀红黄泽谦
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1