【技术实现步骤摘要】
本专利技术属于计算机,尤其涉及一种召回内容的确定方法、召回内容的确定装置和电子设备。
技术介绍
1、在传统的文档问答系统中,答案召回的方法通常是基于问题和文档各个段落的语义相似度的召回,存在一定的局限性,比如,当文档内容过多时,很难准确的找到与问题相关的答案段落,使得问题和文档之间的匹配准确性较低,导致召回的噪声很多,从而影响召回的准确性。
技术实现思路
1、本申请实施例提供一种召回内容的确定方法、召回内容的确定装置和电子设备,能够提升了召回的准确性。
2、第一方面,本申请实施例提供了一种召回内容的确定方法,该方法包括:获取目标问句和所述目标问句对应的多个问答文档;分别计算各所述问答文档对应的各个段落向量与所述目标问句对应的目标向量之间的相似度,其中,所述各个段落向量为各个段落内容的特征向量,所述目标向量包括句向量和多个词向量,所述相似度包括每个所述段落向量与每个所述词向量之间的第一语义相似度、每个所述段落向量与所述句向量之间的第二语义相似度;将每个所述段落内容对应的目标关键词
...【技术保护点】
1.一种召回内容的确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在所述将每个所述段落内容对应的目标关键词匹配个数、多个所述第一语义相似度和多个所述第二语义相似度进行加权计算,得到每个所述段落内容的召回得分之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,在所述通过将所述目标问句输入目标关键词抽取模型,得到所述目标问句的多个所述初始关键词之前,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,通过目标扩展模型对所述目标问句对应的初始关键词进行扩展,包括:
5.根据权利要求
...【技术特征摘要】
1.一种召回内容的确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在所述将每个所述段落内容对应的目标关键词匹配个数、多个所述第一语义相似度和多个所述第二语义相似度进行加权计算,得到每个所述段落内容的召回得分之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,在所述通过将所述目标问句输入目标关键词抽取模型,得到所述目标问句的多个所述初始关键词之前,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,通过目标扩展模型对所述目标问句对应的初始关键词进行扩展,包括:
5.根据权利要求1所述的方法,其特征在于,在所述将每个所述段落内容对应的目标关键词匹配个数、多个所述第一语义相似度和多个所述第二语义相似度进行加权计算,得到每个所述段落内容的召回得分之前,所述方...
【专利技术属性】
技术研发人员:崔明飞,王展,王振,范清,李犇,
申请(专利权)人:北京中关村科金技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。