【技术实现步骤摘要】
本申请涉及信息检索,更具体地说,涉及一种搜索词纠错方法、系统、设备及可读存储介质。
技术介绍
1、随着互联网的快速发展,用户通过搜索引擎可以便捷的获取自己想要的信息,信息检索是当下获取和查询信息最重要的途径之一。但信息检索在给用户获取信息带来便利的同时,还存在一些问题。例如用户在进行检索时由于疏忽或其他原因,会输入错误的搜索词(query),导致搜索引擎返回的信息可能会偏离用户的真实意图,从而影响了用户体验。这样就要求搜索引擎能够对用户输入的错误搜索词纠正成用户实际需要的搜索词。
2、然而现有的搜索词纠正方法普遍存在少召回、过拟合和语义欠缺等问题,也即存在搜索词的纠错准确率不高的问题。
技术实现思路
1、本申请实施例提供了一种搜索词纠错方法、系统、设备及可读存储介质,能够提高搜索词的纠错准确率。
2、有鉴于此,本申请实施例提供了一种搜索词纠错方法,包括:
3、获取用户输入的搜索词;
4、将所述搜索词输入纠错召回模型中进行纠错,得到所述搜索词的
...【技术保护点】
1.一种搜索词纠错方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述搜索词输入纠错召回模型中进行预测,得到所述搜索词的多个纠错候选词,包括:
3.根据权利要求2所述的方法,其特征在于,所述将所述原始纠错候选词和所述原始纠错候选词的正确概率输入解码器中,得到所述搜索词的多个纠错候选词,包括:
4.根据权利要求1所述的方法,其特征在于,所述排序特征包括低阶特征和高阶特征;所述低阶特征包括搜索词的困惑度、所述多个纠错候选词的困惑度、拼音差异和文本相似度中的至少一个;所述高阶特征包括所述纠错召回模型的模型
...【技术特征摘要】
1.一种搜索词纠错方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述搜索词输入纠错召回模型中进行预测,得到所述搜索词的多个纠错候选词,包括:
3.根据权利要求2所述的方法,其特征在于,所述将所述原始纠错候选词和所述原始纠错候选词的正确概率输入解码器中,得到所述搜索词的多个纠错候选词,包括:
4.根据权利要求1所述的方法,其特征在于,所述排序特征包括低阶特征和高阶特征;所述低阶特征包括搜索词的困惑度、所述多个纠错候选词的困惑度、拼音差异和文本相似度中的至少一个;所述高阶特征包括所述纠错召回模型的模型分和深度困惑模型的模型分中的...
【专利技术属性】
技术研发人员:郭磊,赵骥,沈奇,
申请(专利权)人:深圳依时货拉拉科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。