当前位置: 首页 > 专利查询>吉林大学专利>正文

查询分析方法及系统、计算机可读存储介质及终端技术方案

技术编号:34255253 阅读:53 留言:0更新日期:2022-07-24 12:31
本发明专利技术提供了一种查询分析方法及系统、计算机可读存储介质及终端,涉及机器学习领域。其中,该方法包括:确定待查询语句对应的向量,得到待查询向量;将待查询向量输入训练后的第一模型,根据第一模型的输出得到伪标题向量,其中,伪标题向量包含待查询语句的后验检索信息;将待查询语句和伪标题向量输入训练后的第二模型,根据第二模型的输出确定待查询语句的目标预测,并基于目标预测进行查询分析。本技术方案以查询分析中的查询分类方法为例,将后验检索信息引入至先验检索信息场景中,使得分类器性能与之前的查询分类方法相比得到进一步提升,从而使查询分析的性能增强。从而使查询分析的性能增强。从而使查询分析的性能增强。

Query analysis method and system, computer readable storage medium and terminal

【技术实现步骤摘要】
查询分析方法及系统、计算机可读存储介质及终端


[0001]本公开涉及机器学习领域,尤其涉及一种查询分析方法及系统、计算机可读存储介质及终端。

技术介绍

[0002]查询分析方法是搜索引擎的一个关键组成部分,它为召回和排序阶段提供指导意义。随着查询分析发现了更多的语义信息,搜索引擎能够更准确地理解用户的信息需求,并相应地为用户提供更满意的搜索结果。近年来,越来越多的研究工作致力于提升查询分析任务的效率。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]本公开的目的在于提供一种查询分析方法,至少在一定程度上克服相关技术中查询分析的效率有待提高的问题。
[0005]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0006]根据本公开的第一个方面,提供一种查询分析方法,上述方法包括:确定待查询语句对应的向量,得到待查询向量;将上述待查询向量输入训练后的第一模型,根据上述第一模型的输出得到伪标题向量,其中,上述伪标题向量包含上述待查询语句的后验检索信息;将上述待查询语句和上述伪标题向量输入训练后的第二模型,根据上述第二模型的输出确定上述待查询语句的目标预测,并基于上述目标预测进行查询分析。
[0007]在本公开一个实施例中,上述第一模型包括第一编码模型和第二编码模型,上述方法包括:获取N个训练样本,第i个训练样本包括第i查询语句和上述第i查询语句对应的第i标题集合,N为正整数,i为不大于N的正整数;将上述第i查询语句输入第一编码模型,得到上述第i查询语句对应的第i查询向量;将上述第i标题集合输入第二编码模型,得到上述第i标题集合对应的第i标题向量;根据上述第i查询向量和上述第i标题向量确定上述第一模型的第一损失函数;根据上述第一损失函数优化上述第一编码模型的参数及上述第二编码模型的参数,以确定上述训练后的第一模型。
[0008]在本公开一个实施例中,上述第一损失函数计算方法为:其中,minimize Loss
imi
表示计算上述第一损失函数Loss
imi
的最小化,q
i
为上述第i查询向量,t
i
为上述第i标题向量。
[0009]在本公开一个实施例中,上述将上述待查询向量输入训练后的第一模型,根据上述第一模型的输出得到伪标题向量,包括:将上述待查询向量输入上述训练后的第一模型中的第一编码模型,根据上述第一编码模型的输出得到上述伪标题向量。
[0010]在本公开一个实施例中,上述第一模型包括第三编码模型和序列

序列模型,上述方法还包括:获取N个训练样本,第i个训练样本包括第i查询语句和上述第i查询语句对应的第i标题集合,N为正整数,i为不大于N的正整数;将上述第i查询语句输入上述第三编码模型,得到上述第i查询语句对应的上下文向量;通过上述序列

序列模型中的编码器,得到上述上下文向量对应的一组第一隐藏状态;将上述第一隐藏状态的最后一个隐藏状态作为上述第i查询语句对应的第i伪标题向量;确定上述第i标题集合对应的一组第一概率向量;将上述第一隐藏状态和上述第一概率向量输入上述序列

序列模型中的解码器,根据上述解码器的输出得到一组第二隐藏状态;将上述第二隐藏状态输入归一化指数函数,根据上述归一化指数函数的输出得到一组第二概率向量;根据上述第一概率向量和上述第二概率向量的交叉熵函数,确定上述第一模型的第二损失函数;根据上述第二损失函数优化上述第三编码模型的参数及上述序列

序列模型的参数,以确定上述训练后的第一模型。
[0011]在本公开一个实施例中,上述第二损失函数计算方法为:其中,minimizeLoss

imi
表示计算上述第二损失函数Loss

imi
的最小化,为上述第i标题集合对应的一组第一概率向量,为上述第i标题集合对应的一组第二概率向量,CE(
·
)为上述交叉熵函数,O为所有上述标题集合的长度,O为正整数,l为不大于O的正整数。
[0012]在本公开一个实施例中,上述将上述待查询向量输入训练后的第一模型,根据上述第一模型的输出得到伪标题向量,包括:将上述待查询向量输入上述训练后的第一模型中的第三编码模型,得到上述待查询向量对应的上下文向量;通过上述训练后的第一模型中的序列

序列模型中的编码器,得到上述上下文向量对应的一组第一隐藏状态;将上述一组第一隐藏状态中最后一个隐藏状态确定为上述伪标题向量。
[0013]在本公开一个实施例中,上述方法还包括:获取上述第i查询语句对应的第i标签向量,得到N个训练样本;获取在第一模型中得到的上述第i查询语句对应的第i伪标题向量;对上述第i查询语句进行嵌入处理,得到第i嵌入序列;将上述第i伪标题向量和上述第i嵌入序列进行结合处理,并将结合处理后的向量输入至第四编码模型;根据上述第四编码模型的输出得到上述第i查询语句的第i目标表示;将上述第i目标表示输入上述归一化指数函数,根据上述归一化指数函数的输出得到上述目标预测;根据上述第i标签向量和上述目标预测的上述交叉熵函数,确定上述第二模型的第三损失函数;根据上述第三损失函数优化上述第四编码模型的参数,以确定训练后的第二模型。
[0014]在本公开一个实施例中,上述第三损失函数计算方法为:其中,minimizeLoss
int
表示计算上述第三损失函数Loss
int
的最小化,为上述目标预测,为上述第i标签向量,共有G个上述标签向量,G为正整数,j为不大于G的正整数。
[0015]在本公开一个实施例中,上述方法还包括:根据上述第三损失函数及上述第一损失函数或上述第二损失函数确定目标损失函数;根据上述目标损失函数优化上述第一模型和上述第二模型。
[0016]在本公开一个实施例中,上述目标损失函数计算方法为:minimizeLoss=Loss
int
+αLoss
imi
,或minimizeLoss=Loss
int
+αLoss

imi
,其中,minimizeLoss表示计算上述目标损失函数,Loss
imi
为上述第一损失函数、Loss

imi
上述第二损失函数,Loss
int
为上述第三损失函数,α为超参数。
[0017]在本公开一个实施例中,上述将上述待查询语句和上述伪标题向量输入训练后的第二模型,根据上述第二模型的输出确定上述待查询语句的目标预测,包括:将上述待查询向量对应的上下文向量进行嵌入处理,得到嵌入序列;将上述伪标题向量和上述嵌入序列进行结合处理,并将结合处理后的向量输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种查询分析方法,其特征在于,包括:确定待查询语句对应的向量,得到待查询向量;将所述待查询向量输入训练后的第一模型,根据所述第一模型的输出得到伪标题向量,其中,所述伪标题向量包含所述待查询语句的后验检索信息;将所述待查询语句和所述伪标题向量输入训练后的第二模型,根据所述第二模型的输出确定所述待查询语句的目标预测,并基于所述目标预测进行查询分析。2.根据权利要求1所述的查询分析方法,其特征在于,所述第一模型包括第一编码模型和第二编码模型,所述方法包括:获取N个训练样本,第i个训练样本包括第i查询语句和所述第i查询语句对应的第i标题集合,N为正整数,i为不大于N的正整数;将所述第i查询语句输入第一编码模型,得到所述第i查询语句对应的第i查询向量;将所述第i标题集合输入第二编码模型,得到所述第i标题集合对应的第i标题向量;根据所述第i查询向量和所述第i标题向量确定所述第一模型的第一损失函数;根据所述第一损失函数优化所述第一编码模型的参数及所述第二编码模型的参数,以确定所述训练后的第一模型。3.根据权利要求2所述的查询分析方法,其特征在于,所述第一损失函数计算方法为:其中,minimize Loss
imi
表示计算所述第一损失函数Loss
imi
的最小化,q
i
为所述第i查询向量,t
i
为所述第i标题向量。4.根据权利要求2所述的查询分析方法,其特征在于,所述将所述待查询向量输入训练后的第一模型,根据所述第一模型的输出得到伪标题向量,包括:将所述待查询向量输入所述训练后的第一模型中的第一编码模型,根据所述第一编码模型的输出得到所述伪标题向量。5.根据权利要求1所述的查询分析方法,其特征在于,所述第一模型包括第三编码模型和序列

序列模型,所述方法还包括:获取N个训练样本,第i个训练样本包括第i查询语句和所述第i查询语句对应的第i标题集合,N为正整数,i为不大于N的正整数;将所述第i查询语句输入所述第三编码模型,得到所述第i查询语句对应的上下文向量;通过所述序列

序列模型中的编码器,得到所述上下文向量对应的一组第一隐藏状态;将所述第一隐藏状态的最后一个隐藏状态作为所述第i查询语句对应的第i伪标题向量;确定所述第i标题集合对应的一组第一概率向量;将所述第一隐藏状态和所述第一概率向量输入所述序列

序列模型中的解码器,根据所述解码器的输出得到一组第二隐藏状态;将所述第二隐藏状态输入归一化指数函数,根据所述归一化指数函数的输出得到一组第二概率向量;
根据所述第一概率向量和所述第二概率向量的交叉熵函数,确定所述第一模型的第二损失函数;根据所述第二损失函数优化所述第三编码模型的参数及所述序列

序列模型的参数,以确定所述训练后的第一模型。6.根据权利要求5所述的查询分析方法,其特征在于,所述第二损失函数计算方法为:其中,minimize Loss

imi
表示计算所述第二损失函数Loss

imi
的最小化,为所述第i标题集合对应的一组第一概率向量,为所述第i标题集合对应的一组第二概率向量,CE(
·
)为所述交叉熵函数,O为所有所述标题集合的长度,O为正整数,l为不大于O的正整数。7.根据权利要求5所述的查询分析方法,其特征在于,所述将所述待查询向量输入训练后的第一模型,根据所述第一模型的输出得到伪标题向量,包括:将所述待查询向量输入所述训练后的第一模型中的第三编码模型,得到所述待查...

【专利技术属性】
技术研发人员:马雪晴高一星魏骁驰殷大伟常毅
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1