搜索重定向方法及其装置、设备、介质、产品制造方法及图纸

技术编号:31980890 阅读:33 留言:0更新日期:2022-01-20 01:37
本申请涉及电商搜索技术,公开一种搜索重定向方法及其装置、设备、介质、产品,所述方法包括:接收商品搜索请求,获取其中的搜索表达式中的搜索文本;根据搜索纠错模型对所述搜索文本进行文字纠错,获得修正文本;所述搜索纠错模型被预先采用商品标题为训练样本进行训练而适于对其所接收的搜索文本进行文字纠错以获得修正文本;以所述修正文本替换所述搜索表达式中的搜索文本,根据所述搜索表达式启动对商品数据库的搜索,获得商品搜索结果;应答所述商品搜索请求而推送所述商品搜索结果。本申请能够适应商品搜索文本的特点,对用户搜索文本进行智能纠错,实现搜索重定向,提升用户搜索准确率和商品对象被搜索的召回率,特别适用于电商领域。用于电商领域。用于电商领域。

【技术实现步骤摘要】
搜索重定向方法及其装置、设备、介质、产品


[0001]本申请涉及电商搜索技术,尤其涉及一种搜索重定向方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。

技术介绍

[0002]电商搜索引擎一般都是对商品标题分词建立倒排索引,用户搜索时对用户搜索表达式进行分词然后与倒排索引进行匹配召回。如果不对用户搜索表达式做任何改写,只有搜索表达式与商品标题中的词完全匹配时才能被召回,那么虽然这种召回方法比较简单,但也会导致很多问题。
[0003]例如搜索表达式和商品的标题描述语言之间存在一些差异,可能导致一些满足用户搜索表达式意图但不完全匹配的商品无法被召回。熟悉搜索机制的卖家会对标题进行SEO、堆砌与宝贝不符的词,以获取额外流量;而一些大商家的商品标题通常比较简洁,而执行搜索的用户可能无意识地会输入一些冗余的词,因此,过于简洁的商品标题很难与用户搜索表达式完全匹配,导致商品页面无法被召回而损失流量。
[0004]因此,现有技术中,尝试采用多种方式对用户搜索表达式进行重写,以提升搜索匹配效果,使商家的商品能够尽量被精准召回本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种搜索重定向方法,其特征在于,包括:接收商品搜索请求,获取其中的搜索表达式中的搜索文本;根据搜索纠错模型对所述搜索文本进行文字纠错,获得修正文本;所述搜索纠错模型被预先采用商品标题为训练样本进行训练而适于对其所接收的搜索文本进行文字纠错以获得修正文本;以所述修正文本替换所述搜索表达式中的搜索文本,根据所述搜索表达式启动对商品数据库的搜索,获得商品搜索结果;应答所述商品搜索请求而推送所述商品搜索结果。2.根据权利要求1所述的搜索重定向方法,其特征在于,根据预训练的搜索纠错模型对所述搜索文本进行纠错,获得修正文本的步骤中,所述搜索纠错模型包括查错子模型和改错子模型,并执行如下步骤:采用查错子模型检测出所述搜索文本中各个字符的出错概率,所述查错子模型被预训练为适于根据其所接收的搜索文本的上下文信息判别其中每个字符属于错别字的出错概率;根据各个字符的出错概率对各个字符叠加相应程度的屏蔽信息,获得所述搜索文本的屏蔽后特征信息;采用改错子模型对所述屏蔽后特征信息进行多级编码,获得编码后的文本特征信息,并根据该文本特征信息转换出与搜索文本相对应的修正文本。3.根据权利要求2所述的搜索重定向方法,其特征在于,根据各个字符的出错概率对各个字符叠加相应程度的屏蔽信息,获得所述搜索文本的屏蔽后特征信息,包括如下步骤:在向量层面计算与各个字符相对应的屏蔽蒙板与各个字符相应的出错概率的乘积以求得各个字符相应的屏蔽信息,所述出错概率预先被归一化为0至1的区间;在向量层面计算所述各个字符与其以1减去其相应的出错概率的差值之间的乘积以求得各个字符相应的残留信息;在向量层面对各个字符相应的屏蔽信息和残留信息进行加和,获得所述搜索文本相对应的屏蔽后特征信息。4.根据权利要求2所述的搜索重定向方法,其特征在于,所述搜索纠错模型被预训练的过程包括如下步骤:获取样本数据集,所述样本数据集包括多组样本数据,每组样本数据包括一个包含错别字的搜索文本及其对应的修正文本,所述搜索文本中包含与商品信息在语义上相关联的文字信息;调用每组样本数据对所述搜索纠错模型进行训练,训练过程中由所述搜索纠错模型根据所述样本数据中的搜索文本生成修正文本;根据被训练的样本数据中的修正文本对应监督所述搜索纠错模型预测出的修正文本以计算损失值,在损失值大...

【专利技术属性】
技术研发人员:王锋
申请(专利权)人:广州华多网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1