搜索纠错方法、装置、电子设备及介质制造方法及图纸

技术编号:38767683 阅读:18 留言:0更新日期:2023-09-10 10:40
本发明专利技术提供了一种搜索纠错方法、装置、电子设备及介质,包括:获取用户输入的搜索文本,并对搜索文本进行意图识别确定意图类别;基于意图类别确定纠错方式,并基于纠错方式对搜索文本进行处理得到纠错结果;其中,纠错方式至少包括:规则纠错和模型纠错;基于预先确定的选择模型在搜索文本和纠错结果中确定目标搜索文本。本发明专利技术提高了纠错的准确率,提升用户的体验感。的体验感。的体验感。

【技术实现步骤摘要】
搜索纠错方法、装置、电子设备及介质


[0001]本专利技术涉及人工智能
,尤其是涉及一种搜索纠错方法、装置、电子设备及介质。

技术介绍

[0002]随着旅游行业流量的爆发式增长,众多的用户会登录各大旅游平台,参与订车票、订酒店、订景点等相关业务。然后,用户在搜索目标资源时,经常会出现输入文本错误的情况,从而导致无法展示用户想要的资源,降低了用户的体验感。现有的方法大多是通过文本纠错技术,对用户输入的文本进行纠错,但是,现有的纠错方法存在准确率低,效果差的问题。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种搜索纠错方法、装置、电子设备及介质,能够提高了纠错的准确率,提升用户的体验感。
[0004]为了实现上述目的,本专利技术实施例采用的技术方案如下:
[0005]第一方面,本专利技术实施例提供了一种搜索纠错方法,包括:获取用户输入的搜索文本,并对搜索文本进行意图识别确定意图类别;基于意图类别确定纠错方式,并基于纠错方式对搜索文本进行处理得到纠错结果;其中,纠错方式至少包括:规则纠错和模型纠错;基于预先确定的选择模型在搜索文本和纠错结果中确定目标搜索文本。
[0006]在一种实施方式中,基于意图类别确定纠错方式,包括:如果意图类别为交通场景,则确定纠错方式为规则纠错和模型纠错相结合;如果意图类别不是交通场景,则确定纠错方式为模型纠错。
[0007]在一种实施方式中,模型纠错包括:基于预先训练好的纠错模型中,获取搜索文本的模型纠错结果。
[0008]在一种实施方式中,纠错模型至少包括:编码模块、错误检测模块和错误纠正模块;基于预先训练好的纠错模型中,获取搜索文本的模型纠错结果,包括:通过编码模块对搜索文本进行编码得到搜索文本对应的向量矩阵;通过错误检测模块将向量矩阵映射到二维解空间得到搜索文本的错误检测结果;通过错误纠正模块对错误检测结果中存在错误的字符进行标记,并对标记的字符进行预测得到模型纠错结果。
[0009]在一种实施方式中,规则纠错包括:对搜索文本进行预分词得到多个分词;按照预设顺序计算每个分词与候选词集中的词组之间的相似得分;其中,相似得分包括多个维度的得分;基于相似得分确定分词的替换词,并采用替换词替换搜索文本中对应的分词得到规则纠错结果。
[0010]在一种实施方式中,基于相似得分确定分词的替换词,包括:基于相似得分确定候选词集中的词组与分词相似的维度个数,并基于维度个数对候选词集中的词组进行初次排序得到初始替换词;基于预先确定的初始替换词和候选词集中剩余词组的业务权重,以及
分词与初始替换词的相似得分和分词与候选词集中剩余词组的相似得分的差值进行二次排序得到替换词。
[0011]在一种实施方式中,基于预先确定的选择模型在搜索文本和纠错结果中确定目标搜索文本,包括:通过预先确定的选择模型对搜索文本和纠错结果进行编码得到编码结果;对编码结果进行三分类,并根据分类结果确定目标搜索文本。
[0012]第二方面,本专利技术实施例提供了一种搜索纠错装置,包括:意图识别模块,用于获取用户输入的搜索文本,并对搜索文本进行意图识别确定意图类别;纠错模块,用于基于意图类别确定纠错方式,并基于纠错方式对搜索文本进行处理得到纠错结果;其中,纠错方式至少包括:规则纠错和模型纠错;选择模块,用于基于预先确定的选择模型在搜索文本和纠错结果中确定目标搜索文本。
[0013]第三方面,本专利技术实施例提供了一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述第一方面提供的任一项的方法的步骤。
[0014]第四方面,本专利技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述第一方面提供的任一项的方法的步骤。
[0015]本专利技术实施例带来了以下有益效果:
[0016]本专利技术实施例提供的上述搜索纠错方法、装置、电子设备及介质,能够首先获取用户输入的搜索文本,并对搜索文本进行意图识别确定意图类别;然后基于意图类别确定纠错方式(至少包括:规则纠错和模型纠错),并基于纠错方式对搜索文本进行处理得到纠错结果;最后基于预先确定的选择模型在搜索文本和纠错结果中确定目标搜索文本。上述方法能够兼顾规则纠错和模型纠错两种纠错方式,根据意图识别确定采用的纠错方式,并得到纠错结果,提高了纠错的准确率;同时为了避免过度纠错,还可以通过选择模型在搜索文本和纠错结果中,选择最优的结果作为最终的目标搜索文本,从而为用户提供最优的搜索结果,降低了用户搜索的错误率,提升用户的体验感。
[0017]本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
[0018]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0019]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本专利技术实施例提供的一种搜索纠错方法的流程图;
[0021]图2为本专利技术实施例提供的一种纠错模型的结构示意图;
[0022]图3为本专利技术实施例提供的一种搜索纠错系统的架构图;
[0023]图4为本专利技术实施例提供的一种搜索下拉展示内容示意图;
[0024]图5为本专利技术实施例提供的一种搜索纠错装置的结构示意图;
[0025]图6为本专利技术实施例提供的一种电子设备的结构示意图。
具体实施方式
[0026]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]首先,对本专利技术实施例中涉及到的相关术语进行介绍:
[0028]1、自然语言处理(Natural Language Processing,NLP):人工智能和语言学领域的分支科学,旨在让机器理解文字,然后让机器处理、运用人类语言。主要包括机器翻译、文本纠错、实体识别、文本生成等多个研究方向。
[0029]2、Badcase:错误的样例。
[0030]3、在线旅行社(Online Travel Agency,OTA):指售卖旅游产品与服务,包括酒店、机票、车票、景点门票、路线产品等与旅游相关的产品。
[0031]4、自然语言理解(Natural Language U本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种搜索纠错方法,其特征在于,包括:获取用户输入的搜索文本,并对所述搜索文本进行意图识别确定意图类别;基于所述意图类别确定纠错方式,并基于所述纠错方式对所述搜索文本进行处理得到纠错结果;其中,所述纠错方式至少包括:规则纠错和模型纠错;基于预先确定的选择模型在所述搜索文本和所述纠错结果中确定目标搜索文本。2.根据权利要求1所述的方法,其特征在于,基于所述意图类别确定纠错方式,包括:如果所述意图类别为交通场景,则确定所述纠错方式为规则纠错和模型纠错相结合;如果所述意图类别不是交通场景,则确定所述纠错方式为模型纠错。3.根据权利要求2所述的方法,其特征在于,所述模型纠错包括:基于预先训练好的纠错模型中,获取所述搜索文本的模型纠错结果。4.根据权利要求3所述的方法,其特征在于,所述纠错模型至少包括:编码模块、错误检测模块和错误纠正模块;基于预先训练好的纠错模型中,获取所述搜索文本的模型纠错结果,包括:通过所述编码模块对所述搜索文本进行编码得到所述搜索文本对应的向量矩阵;通过所述错误检测模块将所述向量矩阵映射到二维解空间得到所述搜索文本的错误检测结果;通过所述错误纠正模块对所述错误检测结果中存在错误的字符进行标记,并对标记的字符进行预测得到模型纠错结果。5.根据权利要求2所述的方法,其特征在于,所述规则纠错包括:对所述搜索文本进行预分词得到多个分词;按照预设顺序计算每个所述分词与候选词集中的词组之间的相似得分;其中,所述相似得分包括多个维度的得分;基于所述相似得分确定所述分词的替换词,并采用所述替换词替换所述搜索文本中对应的分词得到规则纠错结果。6...

【专利技术属性】
技术研发人员:韩冬马明珠潘钰洲宗寿金吴闯王之
申请(专利权)人:苏州创旅天下信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1