查询反馈方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:25270910 阅读:13 留言:0更新日期:2020-08-14 23:04
本申请是关于一种查询反馈方法、装置、计算机设备及存储介质。该方法包括:对查询语句进行语义特征识别,获得查询语句的识别结果;识别结果包括原始语义实体以及语义信息;基于查询语句的识别结果获取至少两个候选语义实体;基于从至少两个候选语义实体中筛选出目标语义实体;向终端发送目标语义实体对应的反馈结果;该方案基于人工智能技术,结合原始语义实体和语义信息共同查询候选语义实体,使得后续确定出的目标语义实体的来源更为广泛,从而提高目标语义实体的多样性,进而提高反馈结果的多样性,从而达到提高反馈效果的目的。

【技术实现步骤摘要】
查询反馈方法、装置、计算机设备及存储介质
本申请涉及数据检索
,特别涉及一种查询反馈方法、装置、计算机设备及存储介质。
技术介绍
随着搜索技术及其应用的不断发展,基于自然语句进行数据查询及结果反馈是各大搜索引擎的基本功能。在相关技术中,搜索引擎通常基于语义实体来实现针对自然语句的数据查询以及结果反馈。例如,对于用户输入的查询语句,通过语义识别的方式从查询语句中识别出原始语义实体,然后通过原始语义实体查询相似度高的目标语义实体,并进行结果反馈。然而,相关技术中的目标语义实体都是通过原始语义实体查询得到的,导致查询到的目标语义实体的多样性不足,导致查询结果的类型比较单一,影响查询反馈的效果。
技术实现思路
本申请实施例提供了一种查询反馈方法、装置、计算机设备及存储介质,可以提高查询到的目标语义实体的多样性,从而提高针对查询语句的反馈效果,该技术方案如下。一方面,提供了一种查询反馈方法,所述方法包括:获取在终端中输入的查询语句;对所述查询语句进行语义特征识别,获得所述查询语句的识别结果;所述识别结果包括原始语义实体以及语义信息;所述语义信息包括语义标签和语句意图中的至少一种;所述原始语义实体是对应语句中包含的语义实体;基于所述查询语句的识别结果获取至少两个候选语义实体;基于所述至少两个候选语义实体分别与所述查询语句的识别结果中包含的第一原始语义实体之间的相似度,从所述至少两个候选语义实体中筛选出目标语义实体;向所述终端发送所述目标语义实体对应的反馈结果。又一方面,提供了一种查询反馈装置,所述装置包括:查询语句获取模块,用于获取在终端中输入的查询语句;语义识别模块,用于对所述查询语句进行语义特征识别,获得所述查询语句的识别结果;所述识别结果包括原始语义实体以及语义信息;所述语义信息包括语义标签和语句意图中的至少一种;所述原始语义实体是对应语句中包含的语义实体;候选实体获取模块,用于基于所述查询语句的识别结果获取至少两个候选语义实体;目标实体筛选模块,用于基于所述至少两个候选语义实体分别与所述查询语句的识别结果中包含的第一原始语义实体之间的相似度,从所述至少两个候选语义实体中筛选出目标语义实体;反馈模块,用于向所述终端发送所述目标语义实体对应的反馈结果。在一种可能的实现方式中,所述语义识别模块,用于,通过语义识别模型对所述查询语句进行处理,获得所述语义识别模型输出的识别结果;其中,所述语义识别模型是通过查询语句样本以及所述查询语句样本对应的样本标注信息训练得到的多任务学习模型,所述样本标注信息是与所述识别结果同类型的信息。在一种可能的实现方式中,所述装置还包括:处理模块,用于在语义识别模块通过所述语义识别模型对所述查询语句样本进行处理,得到所述查询语句样本的预测结果;损失计算模块,用于将所述预测结果与所述样本标注信息输入损失函数,得到损失函数值;更新模块,用于基于所述损失函数值,对所述语义识别模型中的参数进行更新;其中,所述损失函数中包含缩放系数,且所述缩放系数与预测概率成反相关,所述预测概率是所述语义识别模型预测所述查询语句样本属于正样本或者负样本的概率。在一种可能的实现方式中,响应于所述语义信息中包含第一语义标签,所述候选实体获取模块,用于通过所述第一语义标签从语义本体中查询第一候选语义实体;所述语义本体中包含所述第一语义标签与所述第一候选语义实体之间的对应关系。在一种可能的实现方式中,所述装置还包括:第一历史识别模块,用于在候选实体获取模块基于所述查询语句的识别结果获取至少两个候选语义实体之前,对历史查询语句进行语义特征识别,获得所述历史查询语句的第三语义标签,以及所述历史查询语句的第二原始语义实体;关系建立模块,用于在所述语义本体中建立所述第三语义标签与所述第二原始语义实体之间的对应关系。在一种可能的实现方式中,响应于所述语义信息中包含第一语句意图,所述候选实体获取模块,用于查询与所述第一语句意图相对应的实体类别;通过所述实体类别查询对应的第二候选语义实体。在一种可能的实现方式中,所述候选实体获取模块,用于,获取各个语义实体分别与所述第一原始语义实体在知识图谱中的相似度;所述知识图谱中包含各个语义实体,以及所述各个语义实体之间的边;所述边用于指示对应的两个语义实体之间的相似度;基于所述各个语义实体分别与所述第一原始语义实体在知识图谱中的相似度,从所述各个语义实体中获取第三候选语义实体。在一种可能的实现方式中,所述装置还包括:子相似度获取模块,用于在目标实体筛选模块基于所述至少两个候选语义实体分别与所述查询语句的识别结果中包含的第一原始语义实体之间的相似度,从所述至少两个候选语义实体中筛选出目标语义实体之前,获取第四候选语义实体与所述第一原始语义实体之间的至少两种子相似度;所述第四候选语义实体是所述至少两个候选语义实体中的任意一个;相似度获取模块,用于对所述第四候选语义实体分别与所述第一原始语义实体之间的至少两种子相似度进行加权平均,获得所述第四候选语义实体与所述第一原始语义实体之间的相似度。在一种可能的实现方式中,响应于所述至少两种子相似度中包含共现关系相似度,所述子相似度获取模块,用于,获取第一出现次数以及第二出现次数;所述第一出现次数是所述第一原始语义实体在查询历史中的出现次数;所述第二出现次数是所述第一原始语义实体与所述第四候选语义实体在所述查询历史中共同出现的次数;基于所述第一出现次数与所述第二出现次数获取所述第四候选语义实体与所述第一原始语义实体之间的共现关系相似度。在一种可能的实现方式中,响应于所述至少两种子相似度中包含向量相似度,所述子相似度获取模块,用于,获取所述第四候选语义实体以及所述第一原始语义实体各自的词向量;基于所述第四候选语义实体以及所述第一原始语义实体各自的词向量,获取所述第四候选语义实体与所述第一原始语义实体之间的向量相似度。在一种可能的实现方式中,所述装置还包括:第二历史识别模块,用于在子相似度获取模块获取所述第四候选语义实体以及所述第一原始语义实体各自的词向量之前,对历史查询语句进行语义特征识别,获得所述历史查询语句的识别结果;语料构建模块,用于基于所述历史查询语句的识别结果构建向量矩阵训练语料;矩阵训练模块,用于基于所述向量矩阵训练语料进行向量矩阵训练,获得词向量矩阵;所述子相似度获取模块,用于基于所述词向量矩阵,获取所述第四候选语义实体以及所述第一原始语义实体各自的词向量。在一种可能的实现方式中,响应于所述至少两种子相似度中包含图谱相似度,所述子相似度获取模块,用于获取所述第四候选语义实体与所述第一原始语义实体在知识图谱中的相似度,作为所述第四候选语义实体与所述第一原始语义实体之间的图谱相似度。再一方面,提供了一种计算机设备,本文档来自技高网...

【技术保护点】
1.一种查询反馈方法,其特征在于,所述方法包括:/n获取在终端中输入的查询语句;/n对所述查询语句进行语义特征识别,获得所述查询语句的识别结果;所述识别结果包括原始语义实体以及语义信息;所述语义信息包括语义标签和语句意图中的至少一种;所述原始语义实体是对应语句中包含的语义实体;/n基于所述查询语句的识别结果获取至少两个候选语义实体;/n基于所述至少两个候选语义实体分别与所述查询语句的识别结果中包含的第一原始语义实体之间的相似度,从所述至少两个候选语义实体中筛选出目标语义实体;/n向所述终端发送所述目标语义实体对应的反馈结果。/n

【技术特征摘要】
1.一种查询反馈方法,其特征在于,所述方法包括:
获取在终端中输入的查询语句;
对所述查询语句进行语义特征识别,获得所述查询语句的识别结果;所述识别结果包括原始语义实体以及语义信息;所述语义信息包括语义标签和语句意图中的至少一种;所述原始语义实体是对应语句中包含的语义实体;
基于所述查询语句的识别结果获取至少两个候选语义实体;
基于所述至少两个候选语义实体分别与所述查询语句的识别结果中包含的第一原始语义实体之间的相似度,从所述至少两个候选语义实体中筛选出目标语义实体;
向所述终端发送所述目标语义实体对应的反馈结果。


2.根据权利要求1所述的方法,其特征在于,所述对所述查询语句进行语义特征识别,获得识别结果,包括:
通过语义识别模型对所述查询语句进行处理,获得所述语义识别模型输出的识别结果;
其中,所述语义识别模型是通过查询语句样本以及所述查询语句样本对应的样本标注信息训练得到的多任务学习模型,所述样本标注信息是与所述识别结果同类型的信息。


3.根据权利要求2所述的方法,其特征在于,所述对所述查询语句进行语义特征识别,获得所述查询语句的识别结果之前,还包括:
通过所述语义识别模型对所述查询语句样本进行处理,得到所述查询语句样本的预测结果;
将所述预测结果与所述样本标注信息输入损失函数,得到损失函数值;
基于所述损失函数值,对所述语义识别模型中的参数进行更新;
其中,所述损失函数中包含缩放系数,且所述缩放系数与预测概率成反相关,所述预测概率是所述语义识别模型预测所述查询语句样本属于正样本或者负样本的概率。


4.根据权利要求1所述的方法,其特征在于,响应于所述语义信息中包含第一语义标签,所述基于所述查询语句的识别结果获取至少两个候选语义实体,包括:
通过所述第一语义标签从语义本体中查询第一候选语义实体;所述语义本体中包含所述第一语义标签与所述第一候选语义实体之间的对应关系。


5.根据权利要求4所述的方法,其特征在于,所述基于所述查询语句的识别结果获取至少两个候选语义实体之前,还包括:
对历史查询语句进行语义特征识别,获得所述历史查询语句的第三语义标签,以及所述历史查询语句的第二原始语义实体;
在所述语义本体中建立所述第三语义标签与所述第二原始语义实体之间的对应关系。


6.根据权利要求1所述的方法,其特征在于,响应于所述语义信息中包含第一语句意图,所述基于所述查询语句的识别结果获取至少两个候选语义实体,包括:
查询与所述第一语句意图相对应的实体类别;
通过所述实体类别查询对应的第二候选语义实体。


7.根据权利要求1所述的方法,其特征在于,所述基于所述查询语句的识别结果获取至少两个候选语义实体,包括:
获取各个语义实体分别与所述第一原始语义实体在知识图谱中的相似度;所述知识图谱中包含各个语义实体,以及所述各个语义实体之间的边;所述边用于指示对应的两个语义实体之间的相似度;
基于所述各个语义实体分别与所述第一原始语义实体在知识图谱中的相似度,从所述各个语义实体中获取第三候选语义实体。


8.根据权利要求1所述的方法,其特征在于,所述基于所述至少两个候选语义实体分别与所述查询语句的识别结果中包含的第一原始语义实体之间的相似度,从所述至少两个候选语义实体中筛选出目标语义实体之前,还包括:
获取第四候选语义实体与所述第一原始语义实体之间的至少两种子相似度;所述第四候选语义实体是所述至少两个候选语义实体中...

【专利技术属性】
技术研发人员:赵瑞辉陆扩建赵博黄展鹏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1