【技术实现步骤摘要】
问答索引生成方法、问答模型处理方法、装置和存储介质
[0001]本申请涉及自然语言处理
,特别是涉及一种问答索引生成方法、问答模型处理方法、装置、计算机设备和存储介质。
技术介绍
[0002]随着智能问答技术的发展,在一些应用场景中需要首先通过问答模型从文档中抽取和问题匹配的答案,然后根据问题和与该问题相匹配的答案生成问答索引并存入问答库。然后在用户输入问题时,如果用户所输入的问题和问答索引中的问题语义一致,则将问答索引中与该问题匹配的答案反馈给用户。由于生成的问答索引的准确性直接影响答案的准确性,因此怎样生成高质量的问答索引是本领域技术人员的重要研究方向。
技术实现思路
[0003]基于此,有必要针对上述技术问题,提供一种问答索引生成方法、问答模型处理方法、装置、计算机设备和存储介质,提高了所生成的问答索引的准确性。
[0004]一种问答索引生成方法,所述方法包括:
[0005]对问题文本中的词和阅读文本中的词进行拼接,得到词序列;
[0006]通过问答模型中的各隐含层提取所述 ...
【技术保护点】
【技术特征摘要】
1.一种问答索引生成方法,其特征在于,所述方法包括:对问题文本中的词和阅读文本中的词进行拼接,得到词序列;通过问答模型中的各隐含层提取所述词序列中的词特征;在所述阅读文本中,基于各所述隐含层的词特征分别确定与所述问题文本匹配的答案文本;在所述答案文本中选取得分达到分数阈值的目标答案文本;根据所述问题文本和所述目标答案文本生成目标问答索引。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述阅读文本进行短句划分,得到至少两个短句文本;所述在所述阅读文本中,基于各所述隐含层的词特征分别确定与所述问题文本匹配的答案文本包括:基于各所述隐含层的词特征,分别确定各所述短句文本作为答案起始位置和答案结束位置的预测概率;在所述阅读文本中,基于所述预测概率确定与所述问题文本匹配的答案文本。3.根据权利要求2所述的方法,其特征在于,所述基于各所述隐含层的词特征,分别确定各所述短句文本作为答案起始位置和答案结束位置的预测概率包括:基于每个所述隐含层的词特征,分别确定各所述短句文本对应的句子特征;通过所述问答模型中的答案预测层对所述句子特征进行处理,得到各所述短句文本作为答案起始位置和答案结束位置的预测概率。4.根据权利要求3所述的方法,其特征在于,所述基于每个所述隐含层的词特征,分别确定各所述短句文本对应的句子特征包括:从每个所述隐含层的词特征中,查找属于所述短句文本的词特征;对所述短句文本的词特征进行处理,得到处理结果;对所述处理结果进行归一化,得到所述短句文本中每个词的重要程度值;将所述重要程度值作为权重值对所述短句文本的词特征进行加权;根据加权所得的结果确定所述短句文本对应的句子特征。5.根据权利要求3所述的方法,其特征在于,所述通过所述问答模型中的答案预测层对所述句子特征进行处理,得到各所述短句文本作为答案起始位置和答案结束位置的预测概率包括:基于所述问答模型中的答案预测层的权重参数和偏置参数,对所述句子特征进行线性处理;对处理所得的结果进行归一化,得到各所述短句文本作为答案起始位置和答案结束位置的预测概率。6.根据权利要求2所述的方法,其特征在于,所述预测概率包括所述答案起始位置对应的预测概率和所述答案结束位置对应的预测概率;所述在所述阅读文本中,基于所述预测概率确定与所述问题文本匹配的答案文本包括:在所述答案起始位置对应的预测概率中,选取达到第一阈值的预测概率;在所述答案结束位置对应的预测概率中,选取达到第二阈值的预测概率;基于达到所述第一阈值的预测概率对应的短句文本和达到所述第二阈值的预测概率
对应的短句文本,在所述阅读文本中确定与所述问题文本匹配的答案文本。7.根据权利要求1至6任一项所述的方法,其特征在于,所述在所述答案文本中选取得分达到分数阈值的目标答案文本包括:确定相同所述答案文本的个数;基于相同所述答案文本的个数与不同所述答案文本的个数间的比值,确定所述答案文本的得分;选取所述得分达到分数阈值的答案文本作为目标答案文本。8.根据权利要求1所述的方法,其特征在于,所述问答模型是对训练前的问答模型进行训练所得;所述对训练前的问答模型进行训练包括:对问题文本样本中的词和阅读文本样本中的词进行拼接,得到词序列样本;通过训练前的问答模型中的各隐含层对所述词序列样本进行词特征提取,得到各所述隐含层对应的训练词特征;训练前的所述问答模型中还包含与最后一个所述隐含层对应的答案预测层;通过所述答案预测层对最后一个所述隐含层的训练词特征进行特征处理,以在所述阅读文本样本中获得与所述问题文本样本匹配的第一训练答案文本;基于所述...
【专利技术属性】
技术研发人员:王唯康,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。