信息检索方法和装置、存储介质及电子设备制造方法及图纸

技术编号:35059021 阅读:13 留言:0更新日期:2022-09-28 11:10
本申请公开了一种信息检索方法和装置、存储介质及电子设备。其中,该方法包括:获取信息检索请求,将目标问题信息和候选答案信息输入目标问答预测模型,通过目标问答预测模型将目标问题信息转换为目标问题表征向量,并将候选答案信息转换为原始答案表征向量,将原始答案表征向量转换成多个答案表征向量,并根据多个答案表征向量,确定用于表征候选答案信息的目标答案表征向量,根据目标问题表征向量和目标答案表征向量,确定目标问题信息与候选答案信息的匹配度,进而确定候选答案信息是否为与目标问题信息匹配的答案信息。本申请可以应用于包括但不限于人工智能领域,本申请解决了相关技术中问答检索模型的检索准确率较低的技术问题。问题。问题。

【技术实现步骤摘要】
信息检索方法和装置、存储介质及电子设备


[0001]本申请涉及计算机领域,具体而言,涉及一种信息检索方法和装置、存储介质及电子设备。

技术介绍

[0002]传统的问答检索模型一般是采用无监督训练模型和有监督训练模型,其中,无监督训练模型不需要训练数据,但本质是检索问题和检索答案中的词的匹配,难以解决语义上的匹配问题,效果一般比较差。而采用的是有监督训练模型,需要大量的标注的训练数据,分别把用户检索的问题和检索到的完整段落通过模型编码成单独的向量,以确定向量之间的相似度。
[0003]但这种方式由于一般文章或者段落都比较长,编码成一个向量会有信息损失,而且这种方式也没有将用户检索的问题和检索到的完整段落做更细粒度的匹配。
[0004]因此,相关技术中存在问答检索模型在计算过程中,出现信息损失,导致问答检索模型的检索准确率较低的技术问题。
[0005]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0006]本申请实施例提供了一种信息检索方法和装置、存储介质及电子设备,以至少解决相关技术中问答检索模型的检索准确率较低的技术问题。
[0007]根据本申请实施例的一个方面,提供了一种信息检索方法,包括:将所述目标问题信息和候选答案信息输入目标问答预测模型,通过所述目标问答预测模型将所述目标问题信息转换为目标问题表征向量,并将所述候选答案信息转换为原始答案表征向量;通过所述目标问答预测模型将所述原始答案表征向量转换成多个答案表征向量,并根据所述多个答案表征向量,确定用于表征所述候选答案信息的目标答案表征向量,其中,所述多个答案表征向量是对所述原始答案表征向量进行不同的线性变换所得到的向量;通过所述目标问答预测模型根据所述目标问题表征向量和所述目标答案表征向量,确定所述目标问题信息与所述候选答案信息的匹配度;根据所述目标问题信息与所述候选答案信息的匹配度,确定所述候选答案信息是否为与所述目标问题信息匹配的答案信息。
[0008]根据本申请实施例的另一方面,还提供了一种信息检索装置,包括:获取模块,用于获取信息检索请求,其中,所述信息检索请求中携带有目标问题信息;转换模块,用于将所述目标问题信息和候选答案信息输入目标问答预测模型,通过所述目标问答预测模型将所述目标问题信息转换为目标问题表征向量,并将所述候选答案信息转换为原始答案表征向量;处理模块,用于通过所述目标问答预测模型将所述原始答案表征向量转换成多个答案表征向量,并根据所述多个答案表征向量,确定用于表征所述候选答案信息的目标答案表征向量,其中,所述多个答案表征向量是对所述原始答案表征向量进行不同的线性变换所得到的向量;第一确定模块,用于通过所述目标问答预测模型根据所述目标问题表征向
量和所述目标答案表征向量,确定所述目标问题信息与所述候选答案信息的匹配度;第二确定模块,用于根据所述目标问题信息与所述候选答案信息的匹配度,确定所述候选答案信息是否为与所述目标问题信息匹配的答案信息。获取信息检索请求,其中,所述信息检索请求中携带有目标问题信息;
[0009]可选地,所述装置用于通过如下方式通过所述目标问答预测模型将所述原始答案表征向量转换成多个答案表征向量:获取预设的多个不同的转换矩阵,其中,每个所述转换矩阵用于对所述原始答案表征向量进行线性变换;将所述多个不同的转换矩阵中每个转换矩阵分别与所述原始答案表征向量相乘,得到所述多个答案表征向量。
[0010]可选地,所述装置用于通过如下方式获取预设的多个不同的转换矩阵:根据所述信息检索请求确定所述目标问题信息的关键词属性;在所述关键词属性表示所述目标问题信息所查找的答案的词性的情况下,获取预设的多个不同的词性转换矩阵;所述装置用于通过如下方式将所述多个不同的转换矩阵中每个转换矩阵分别与所述原始答案表征向量相乘,得到所述多个答案表征向量:将所述多个不同的词性转换矩阵中每个转换矩阵分别与所述原始答案表征向量相乘,得到所述多个答案表征向量。
[0011]可选地,所述装置用于通过如下方式获取预设的多个不同的转换矩阵:将所述候选答案信息拆分成多个句子,识别所述多个句子的语义信息;获取与所述多个句子的语义信息对应的多个不同的语义转换矩阵;所述装置用于通过如下方式将所述多个不同的转换矩阵中每个转换矩阵分别与所述原始答案表征向量相乘,得到所述多个答案表征向量:将所述多个不同的语义转换矩阵中每个转换矩阵分别与所述原始答案表征向量相乘,得到所述多个答案表征向量。
[0012]可选地,所述装置用于通过如下方式根据所述多个答案表征向量,确定用于表征所述候选答案信息的目标答案表征向量:在所述多个答案表征向量为n个答案表征向量的情况下,分别对所述目标问题表征向量和所述n个答案表征向量中的每个答案表征向量执行内积运算,共得到n个匹配值,其中,n为大于或等于2的正整数;获取所述n个匹配值中的每个匹配值与目标匹配总和的比值,得到n个权重值,其中,所述目标匹配总和是所述n个匹配值的和;使用所述n个权重值对所述n个答案表征向量进行加权求和,得到所述目标答案表征向量。
[0013]可选地,所述装置还用于:获取一组问答信息样本对、样本问题信息集合和样本答案信息集合,其中,所述一组问答信息样本对中每个问答信息样本对包括样本问题信息和已标注的与所述样本问题信息匹配的样本答案;使用所述一组问答信息样本对、所述样本问题信息集合以及所述样本答案信息集合对待训练的问答预测模型进行多轮训练,在所述待训练的问答预测模型对应的预设损失函数的取值满足预设收敛条件时,结束训练,将结束训练时的所述待训练的问答预测模型确定为所述目标问答预测模型。
[0014]可选地,所述装置用于通过如下方式使用所述一组问答信息样本对、所述样本问题信息集合以及所述样本答案信息集合对待训练的问答预测模型进行多轮训练:在所述多轮训练中的第i轮训练中,当第i轮输入所述待训练的问答预测模型中的目标样本问题信息是所述样本问题信息集合中的样本问题信息时,根据所述目标样本问题信息与目标样本答案信息更新第i+1轮训练时所使用的所述样本问题信息集合和所述样本答案信息集合,所述目标样本答案信息是根据所述一组问答信息样本对的样本答案对所述待训练的问答预
测模型在所述第i轮训练中确定的答案信息进行标注得到的样本答案信息,i为大于或等于1的正整数。
[0015]可选地,所述装置用于通过如下方式使用所述一组问答信息样本对、所述样本问题信息集合以及所述样本答案信息集合对待训练的问答预测模型进行多轮训练:在所述第i轮训练中,在所述样本问题信息集合中选择第i轮使用的样本问题信息,对于第i轮使用的样本问题信息与所述样本答案信息集合中的每个样本答案信息执行以下步骤,其中,在执行以下步骤时,所述第i轮使用的样本问题信息为当前样本问题信息,每个样本答案信息为当前样本答案信息:将所述当前样本问题信息和所述当前样本答案信息输入问答预测模型,通过第i

1轮训练得到的问答预测模型将所述当前样本问题信息转换为当前样本问题表征向量,将所述当本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息检索方法,其特征在于,包括:获取信息检索请求,其中,所述信息检索请求中携带有目标问题信息;将所述目标问题信息和候选答案信息输入目标问答预测模型,通过所述目标问答预测模型将所述目标问题信息转换为目标问题表征向量,并将所述候选答案信息转换为原始答案表征向量;通过所述目标问答预测模型将所述原始答案表征向量转换成多个答案表征向量,并根据所述多个答案表征向量,确定用于表征所述候选答案信息的目标答案表征向量,其中,所述多个答案表征向量是对所述原始答案表征向量进行不同的线性变换所得到的向量;通过所述目标问答预测模型根据所述目标问题表征向量和所述目标答案表征向量,确定所述目标问题信息与所述候选答案信息的匹配度;根据所述目标问题信息与所述候选答案信息的匹配度,确定所述候选答案信息是否为与所述目标问题信息匹配的答案信息。2.根据权利要求1所述的方法,其特征在于,所述通过所述目标问答预测模型将所述原始答案表征向量转换成多个答案表征向量,包括:获取预设的多个不同的转换矩阵,其中,每个所述转换矩阵用于对所述原始答案表征向量进行线性变换;将所述多个不同的转换矩阵中每个转换矩阵分别与所述原始答案表征向量相乘,得到所述多个答案表征向量。3.根据权利要求2所述的方法,其特征在于,所述获取预设的多个不同的转换矩阵,包括:根据所述信息检索请求确定所述目标问题信息的关键词属性;在所述关键词属性表示所述目标问题信息所查找的答案的词性的情况下,获取预设的多个不同的词性转换矩阵;所述将所述多个不同的转换矩阵中每个转换矩阵分别与所述原始答案表征向量相乘,得到所述多个答案表征向量,包括:将所述多个不同的词性转换矩阵中每个转换矩阵分别与所述原始答案表征向量相乘,得到所述多个答案表征向量。4.根据权利要求2所述的方法,其特征在于,所述获取预设的多个不同的转换矩阵,包括:将所述候选答案信息拆分成多个句子,识别所述多个句子的语义信息;获取与所述多个句子的语义信息对应的多个不同的语义转换矩阵;所述将所述多个不同的转换矩阵中每个转换矩阵分别与所述原始答案表征向量相乘,得到所述多个答案表征向量,包括:将所述多个不同的语义转换矩阵中每个转换矩阵分别与所述原始答案表征向量相乘,得到所述多个答案表征向量。5.根据权利要求1所述的方法,其特征在于,所述根据所述多个答案表征向量,确定用于表征所述候选答案信息的目标答案表征向量,包括:在所述多个答案表征向量为n个答案表征向量的情况下,分别对所述目标问题表征向量和所述n个答案表征向量中的每个答案表征向量执行内积运算,共得到n个匹配值,其中,n为大于或等于2的正整数;获取所述n个匹配值中的每个匹配值与目标匹配总和的比值,得到n个权重值,其中,所述目标匹配总和是所述n个匹配值的和;
使用所述n个权重值对所述n个答案表征向量进行加权求和,得到所述目标答案表征向量。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取一组问答信息样本对、样本问题信息集合和样本答案信息集合,其中,所述一组问答信息样本对中每个问答信息样本对包括样本问题信息和已标注的与所述样本问题信息匹配的样本答案;使用所述一组问答信息样本对、所述样本问题信息集合以及所述样本答案信息集合对待训练的问答预测模型进行多轮训练,在所述待训练的问答预测模型对应的预设损失函数的取值满足预设收敛条件时,结束训练,将结束训练时的所述待训练的问答预测模型确定为所述目标问答预测模型。7.根据权利要求6所述的方法,其特征在于,所述使用所述一组问答信息样本对、所述样本问题信息集合以及所述样本答案信息集合对待训练的问答预测模型进行多轮训练,包括:在所述多轮训练中的第i轮训练中,当第i轮输入所述待训练的问答预测模型中的目标样本问题信息是所述样本问题信息集合中的样本问题信息时,根据所述目标样本问题信息与目标样本答案信息更新第i+1轮训练时所使用的所述样本问题信息集合和所述样本答案信息集合,所述目标样本答案信息是根据所述一组问答信息样本对的样本答案对所述待训练的问答预测模型在所述第i轮训练中确定的答案信息进行标注得到的样本答案信息,i为大于或等于1的正整数。8.根据权利要求6所述的方法,其特征在于,所述使用所述一组问答信息样本对、所述样本问题信息集合以及所述样本答案信息集合对待训练的问答预测模型进行多轮训练,包括:在所述第i轮训练中,在所述样本问题信息集合中选择第i轮使用的样本问题信息,对于第i轮使用的样本问题信息与所述样本答案信息集合中的每个样本答案信息执行以下步骤,其中,在执行以下步骤时,所述第i轮使用的样本问题信息为当前样本问题信息,每个样本答案信息为当前样本答案信息:将所述当前样本问题信息和所述当前样本答案信息输入问答预测模型,通过第i

1轮训练得到的问答预测模型将所述当前...

【专利技术属性】
技术研发人员:杨韬
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1