一种搜索词纠错方法、系统、设备及可读存储介质技术方案

技术编号:44822046 阅读:16 留言:0更新日期:2025-03-28 20:11
本申请公开了一种搜索词纠错方法、系统、设备及可读存储介质,涉及信息检索技术领域,包括:获取用户输入的搜索词;将搜索词输入纠错召回模型中进行预测,得到搜索词的多个纠错候选词;确定多个纠错候选词的排序特征;将多个纠错候选词、多个纠错候选词的排序特征输入排序模型中对多个纠错候选词进行排序,得到目标纠错候选词。可见,本申请通过将用户输入的搜索词输入到纠错召回模型中预测得到多个纠错候选词,并通过将多个纠错候选词和多个纠错候选词的排序特征输入排序模型中,可以得到准确性更高的目标纠错候选词,从而提高了搜索词的纠错准确率。

【技术实现步骤摘要】

本申请涉及信息检索,更具体地说,涉及一种搜索词纠错方法、系统、设备及可读存储介质


技术介绍

1、随着互联网的快速发展,用户通过搜索引擎可以便捷的获取自己想要的信息,信息检索是当下获取和查询信息最重要的途径之一。但信息检索在给用户获取信息带来便利的同时,还存在一些问题。例如用户在进行检索时由于疏忽或其他原因,会输入错误的搜索词(query),导致搜索引擎返回的信息可能会偏离用户的真实意图,从而影响了用户体验。这样就要求搜索引擎能够对用户输入的错误搜索词纠正成用户实际需要的搜索词。

2、然而现有的搜索词纠正方法普遍存在少召回、过拟合和语义欠缺等问题,也即存在搜索词的纠错准确率不高的问题。


技术实现思路

1、本申请实施例提供了一种搜索词纠错方法、系统、设备及可读存储介质,能够提高搜索词的纠错准确率。

2、有鉴于此,本申请实施例提供了一种搜索词纠错方法,包括:

3、获取用户输入的搜索词;

4、将所述搜索词输入纠错召回模型中进行纠错,得到所述搜索词的多个纠错候选词;...

【技术保护点】

1.一种搜索词纠错方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述搜索词输入纠错召回模型中进行预测,得到所述搜索词的多个纠错候选词,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述原始纠错候选词和所述原始纠错候选词的正确概率输入解码器中,得到所述搜索词的多个纠错候选词,包括:

4.根据权利要求1所述的方法,其特征在于,所述排序特征包括低阶特征和高阶特征;所述低阶特征包括搜索词的困惑度、所述多个纠错候选词的困惑度、拼音差异和文本相似度中的至少一个;所述高阶特征包括所述纠错召回模型的模型分和深度困惑模型的模...

【技术特征摘要】

1.一种搜索词纠错方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述搜索词输入纠错召回模型中进行预测,得到所述搜索词的多个纠错候选词,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述原始纠错候选词和所述原始纠错候选词的正确概率输入解码器中,得到所述搜索词的多个纠错候选词,包括:

4.根据权利要求1所述的方法,其特征在于,所述排序特征包括低阶特征和高阶特征;所述低阶特征包括搜索词的困惑度、所述多个纠错候选词的困惑度、拼音差异和文本相似度中的至少一个;所述高阶特征包括所述纠错召回模型的模型分和深度困惑模型的模型分中的...

【专利技术属性】
技术研发人员:郭磊赵骥沈奇
申请(专利权)人:深圳依时货拉拉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1