查询结果的确定方法、装置、服务器及存储介质制造方法及图纸

技术编号:23983656 阅读:40 留言:0更新日期:2020-04-29 12:30
本申请公开了一种查询结果的确定方法、装置、服务器及存储介质,属于自然语言处理领域。方法包括:获取查询请求中包含的查询词;将查询词输入语义向量生成模型,得到查询词对应的第一语义向量,语义向量生成模型用于按字粒度对输入内容进行划分,并对划分结果的语义进行向量化表示;根据第一语义向量与各个第二语义向量的向量相似度,从第二语义向量中确定出至少一个候选语义向量;将候选语义向量对应的商品词确定为响应查询请求的查询结果。采用本申请的方法,可直接利用语义向量生成模型对查询词向量化并得到第一语义向量,此外,按字粒度对查询词划分减少了对查询词进行分词的过程,进而在提高查询结果的准确性的基础上提高了模型处理效率。

Determination method, device, server and storage medium of query results

【技术实现步骤摘要】
查询结果的确定方法、装置、服务器及存储介质
本申请实施例涉及自然语言处理领域,特别涉及一种查询结果的确定方法、装置、服务器及存储介质。
技术介绍
文本匹配是自然语言处理中的一个核心问题,如在电商领域,商品搜索任务就是一个查询词和商品词的匹配过程,商品搜索任务的核心问题是将用户输入的查询词和最佳的候选商品词匹配起来。其中,商品搜索任务一般分为获取查询结果和对查询结果进行排序这两部分,当用户发起一次商品搜索任务时,根据用户提供的查询词在海量的商品中找出相关的候选商品集,继而对候选商品集根据不同的规则进行打分,根据打分结果对各个候选商品集进行排序,最终在终端界面呈现查询结果。相关技术中,存在多种完成商品搜索任务的方法。如,构建同义词词典和核心词词典,将用户提供的查询词进行同义词扩展和核心词抽取,将拓展和抽取的词作为新的查询词进行查询,并得到不同路的查询结果,将各路的查询结果取并集得到最终的查询结果;又如,对查询词和所有商品词做向量化,得到查询词和商品词的词向量,并将词向量取平均得到查询词和商品词的句向量,求取查询词和所有商品中向量距离最近的商品作为查询结果。然后上述完成商品搜索任务的方法过度依赖于分词结果,根据分词结果生成对应的词向量,对于特定领域的商品搜索任务而言,如分词效果不佳的生鲜领域,查询结果不是很理想,此外,平均求得的句向量无法体现特殊字或词在整个句子中的权重,使得查询结果不精准。
技术实现思路
本申请实施例提供了一种查询结果的确定方法、装置、服务器及存储介质,所述技术方案如下:一方面,提供了一种查询结果的确定方法,所述方法包括:获取查询请求中包含的查询词;将所述查询词输入语义向量生成模型,得到所述查询词对应的第一语义向量,所述语义向量生成模型用于按字粒度对输入内容进行划分,并对划分结果的语义进行向量化表示;根据所述第一语义向量与各个第二语义向量的向量相似度,从所述第二语义向量中确定出至少一个候选语义向量,所述第二语义向量是商品库中商品词对应的语义向量;将所述候选语义向量对应的商品词确定为响应所述查询请求的查询结果。另一方面,提供了一种查询结果的确定装置,所述装置包括:查询词获取模块,用于获取查询请求中包含的查询词;语义向量生成模块,用于将所述查询词输入语义向量生成模型,得到所述查询词对应的第一语义向量,所述语义向量生成模型用于按字粒度对输入内容进行划分,并对划分结果的语义进行向量化表示;语义向量确定模块,用于根据所述第一语义向量与各个第二语义向量的向量相似度,从所述第二语义向量中确定出至少一个候选语义向量,所述第二语义向量是商品库中商品词对应的语义向量;查询结果确定模块,用于将所述候选语义向量对应的商品词确定为响应所述查询请求的查询结果。另一方面,提供了一种服务器,所述服务器包括处理器和存储器;所述存储器存储有至少一条指令,所述至少一条指令用于被所述处理器执行以实现如上述方面所述的查询结果的确定方法。另一方面,提供了一种计算机可读存储介质,所述存储介质存储有至少一条指令,所述至少一条指令用于被处理器执行以实现如上述方面所述的查询结果的确定方法。另一方面,还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述方面所述的查询结果的确定方法。本申请实施例中,服务器通过语义向量生成模型获取查询词对应的第一语义向量,并计算第一语义向量与商品库中商品词对应的第二语义向量的向量相似度,从第二语义向量中确定出至少一个候选语义向量作为响应查询请求的查询结果。基于本申请实施例提供的查询结果的确定方法,可直接利用语义向量生成模型对查询词进行向量化并得到查询词对应的第一语义向量,简化了相关技术中的语义向量生成过程;此外,语义向量生成模型直接按字粒度对查询词进行划分,减少对查询词进行分词的过程,从而在使得语义向量的语义表征更为准确的基础上提高了语义向量生成模型处理输入内容的效率,尤其是在对分词精度要求较高的领域,与相关技术中的词粒度划分方法相比,本申请实施例有助于提高查询结果的准确性。附图说明图1示出了本申请一示例性实施例提供的计算机系统的示意图;图2示出了本申请一示例性实施例提供的查询结果的确定方法的流程图;图3示出了本申请另一示例性实施例提供的查询结果的确定方法的流程图;图4示出了本申请一示例性实施例提供的语义向量生成模型训练的流程图;图5示出了本申请另一示例性实施例提供的语义向量生成模型训练的流程图;图6示出了本申请一示例性实施例提供的语义向量生成模型的结构示意图;图7示出了本申请另一示例性实施例提供的查询结果的确定方法的流程图;图8示出了本申请一示例性实施例提供的查询结果的确定装置的结构框图;图9示出了本申请一示例性实施例提供的服务器的结构方框图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请提供的查询结果的确定方法能够广泛应用于需要进行目标对象搜索的场景中,如在电商领域,该目标对象为商品库中用户意向购买的商品,又如人事系统中,该目标对象为符合空缺职位的候选人员,等等。为了方便下述实施例的阐述,本申请各个实施例以电商领域为例进行示意性的说明,但并不对本申请造成限定。请参考图1,其示出了本申请一示例性实施例提供的计算机系统的示意图。该计算机系统包括终端110和服务器120,其中,终端110与服务器120之间通过通信网络进行数据通信,可选的,通信网络可以是有线网络也可以是无线网络,且该通信网络可以是局域网、城域网以及广域网中的至少一种。终端110中安装有具备商品搜索功能的应用程序,如各类购物软件。可选的,终端110可以是智能手机、平板电脑、膝上便携式笔记本电脑等移动终端,也可以是台式电脑、投影式电脑等终端,本申请实施例对此不做限定。服务器120可以实现为一台服务器,也可以实现为一组服务器构成的服务器集群,其可以是物理服务器,也可以实现为云服务器。在一种可能的实施方式中,服务器120是终端110中应用程序的后台服务器。在一个示例中,如图1所示,终端110安装有一款水果购买软件,此时终端110接收用户在搜索引擎触发的查询操作,该查询操作用于指示用户此时有意向搜索查询词A对应的商品,或者当查询词A对应的商品不存在时,用户意向搜索与查询词A对应商品相近的商品。终端110根据该查询操作生成查询请求,并向水果购买软件后台的服务器120发送该查询请求。在服务器120一侧,服务器120根据查询请求获取查询词A,并将该查本文档来自技高网...

【技术保护点】
1.一种查询结果的确定方法,其特征在于,所述方法包括:/n获取查询请求中包含的查询词;/n将所述查询词输入语义向量生成模型,得到所述查询词对应的第一语义向量,所述语义向量生成模型用于按字粒度对输入内容进行划分,并对划分结果的语义进行向量化表示;/n根据所述第一语义向量与各个第二语义向量的向量相似度,从所述第二语义向量中确定出至少一个候选语义向量,所述第二语义向量是商品库中商品词对应的语义向量;/n将所述候选语义向量对应的商品词确定为响应所述查询请求的查询结果。/n

【技术特征摘要】
1.一种查询结果的确定方法,其特征在于,所述方法包括:
获取查询请求中包含的查询词;
将所述查询词输入语义向量生成模型,得到所述查询词对应的第一语义向量,所述语义向量生成模型用于按字粒度对输入内容进行划分,并对划分结果的语义进行向量化表示;
根据所述第一语义向量与各个第二语义向量的向量相似度,从所述第二语义向量中确定出至少一个候选语义向量,所述第二语义向量是商品库中商品词对应的语义向量;
将所述候选语义向量对应的商品词确定为响应所述查询请求的查询结果。


2.根据权利要求1所述的方法,其特征在于,所述语义向量生成模型包括表示层和编码层;
所述将所述查询词输入语义向量生成模型,得到所述查询词对应的第一语义向量,包括:
将所述查询词输入所述表示层,得到第一字向量组,所述第一字向量组中包含所述查询词中各个字对应的字向量;
将所述第一字向量组输入所述编码层,得到所述第一语义向量。


3.根据权利要求2所述的方法,其特征在于,所述表示层基于双向编码器表征模型构建,所述编码层基于长短时记忆网络构建。


4.根据权利要求2所述的方法,其特征在于,所述获取查询请求中包含的查询词之前,所述方法还包括:
获取训练样本集,所述训练样本集中包括样本查询词、正样本商品词和至少一个负样本商品词,所述正样本商品词是所述样本查询词对应相关商品的商品词;
将所述训练样本集输入所述表示层,得到样本字向量组,所述样本字向量组中包含所述样本查询词对应的第一样本字向量组、所述正样本商品词对应的第二样本字向量组以及所述负样本商品词对应的第三样本字向量组,
将所述样本字向量组输入所述编码层,得到样本语义向量,所述样本语义向量包含所述样本查询词对应的第一样本语义向量、所述正样本商品词对应的第二样本语义向量以及所述负样本商品词对应的第三样本语义向量;
计算所述第一样本语义向量与所述第二样本语义向量的正样本向量相似度,以及所述第一样本语义向量与各个所述第三样本语义向量的负样本向量相似度;
根据所述正样本向量相似度和所述负样本向量相似度训练所述语义向量生成模型。


5.根据权利要求4所述的方法,其特征在于,所述编码层包括第一编码网络和第二编码网络,所述第一编码网络和所述第二编码网络的网络参数不同;
所述将所述样本字向量组输入所述编码层,得到样本语义向...

【专利技术属性】
技术研发人员:张辰蔚
申请(专利权)人:北京每日优鲜电子商务有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1