答案摘要抽取方法、答案摘要抽取模型的训练方法及装置制造方法及图纸

技术编号:36643965 阅读:11 留言:0更新日期:2023-02-18 13:02
本申请公开了一种答案摘要抽取方法、答案摘要抽取模型的训练方法及装置,属于人工智能技术领域。所述方法包括:获取输入问题;基于输入问题,确定与输入问题对应的解答文本;将输入问题与解答文本输入至答案摘要抽取模型进行答案摘要抽取处理,得到与输入问题对应的答案摘要信息;其中,答案摘要抽取模型是以样本问题、样本解答文本以及样本解答文本中各文本单元对应的概率分布信息作为标签信息进行训练得到,概率分布信息由样本解答文本中候选答案与标注答案之间的相似度信息确定,且用于表征解答文本中文本单元分别为答案摘要的起始位置和结束位置的概率。本申请基于上述方法训练优化答案摘要抽取模型,提升模型抽取答案摘要的准确性和灵活性。要的准确性和灵活性。要的准确性和灵活性。

【技术实现步骤摘要】
答案摘要抽取方法、答案摘要抽取模型的训练方法及装置


[0001]本申请涉及人工智能
,特别涉及一种答案摘要抽取方法、答案摘要抽取模型的训练方法及装置。

技术介绍

[0002]随着信息技术的快速发展,快速便捷地获取信息已成为用户的重要需求,智能问答服务收到广泛关注,如何快速准确地为用户提供所需的信息也成为了需要解决的重要难题。
[0003]为了方便用户快速精准地找到想要的信息,一些应用程序中一般会提供智能问答服务,例如智能客服、智能问诊等服务。相关技术中,智能问答服务一般将用户输入的问题输入至机器学习模型,进而输出与用户输入的问题相关的文本信息,并反馈给用户。其中,机器学习模型一般是以人工标注的答案作为标签信进行训练,标签值一般也是离散的数值,如0或1。
[0004]相关技术中,机器学习模型训练时使用的标签信息单一,对人工标注质量依赖性强,模型容易过拟合。

技术实现思路

[0005]本申请实施例提供了一种答案摘要抽取方法、答案摘要抽取模型的训练方法及装置,能够丰富样本的标签信息,降低了模型人工标注质量的依赖程度,有效防止模型过拟合,提升了模型抽取答案摘要的准确性和灵活性。
[0006]根据本申请实施例的一个方面,提供了一种答案摘要抽取方法,所述方法包括:
[0007]获取所述输入问题;
[0008]基于所述输入问题,确定与所述输入问题对应的解答文本;
[0009]将所述输入问题与所述解答文本输入至答案摘要抽取模型进行答案摘要抽取处理,得到与所述输入问题对应的答案摘要信息;
[0010]其中,所述答案摘要抽取模型是以样本问题、样本解答文本以及所述样本解答文本中各文本单元对应的概率分布信息作为标签信息进行训练得到的机器学习模型,所述概率分布信息由所述样本解答文本中至少一个候选答案与所述样本问题对应的标注答案之间的相似度信息确定,且用于表征所述解答文本中文本单元分别为预测答案摘要信息的起始位置和结束位置的概率。
[0011]根据本申请实施例的一个方面,提供了一种答案摘要抽取模型的训练方法,所述方法包括:
[0012]获取样本问题、样本解答文本以及与所述样本问题对应的标注答案,所述样本解答文本包括至少一个候选答案;
[0013]确定所述至少一个候选答案与所述标注答案之间的相似度信息;
[0014]基于所述相似度信息,确定所述样本解答文本中各文本单元对应的概率分布信
息,所述概率分布信息用于表征所述各文本单元分别为答案摘要信息的起始位置和结束位置的概率;
[0015]将所述概率分布信息作为标签信息进行机器学习训练,得到答案摘要抽取模型,以使所述答案摘要抽取模型基于输入问题确定与所述输入问题对应的答案摘要信息。
[0016]根据本申请实施例的一个方面,提供了一种答案摘要抽取装置,所述装置包括:
[0017]问题获取模块,用于获取所述输入问题;
[0018]解答文本确定模块,用于基于所述输入问题,确定与所述输入问题对应的解答文本;
[0019]答案摘要抽取模块,用于将所述输入问题与所述解答文本输入至答案摘要抽取模型进行答案摘要抽取处理,得到与所述输入问题对应的答案摘要信息;
[0020]其中,所述答案摘要抽取模型是以样本问题、样本解答文本以及所述样本解答文本中各文本单元对应的概率分布信息作为标签信息进行训练得到的机器学习模型,所述概率分布信息由所述样本解答文本中至少一个候选答案与所述样本问题对应的标注答案之间的相似度信息确定,且用于表征所述解答文本中文本单元分别为预测答案摘要信息的起始位置和结束位置的概率。
[0021]根据本申请实施例的一个方面,提供了一种答案摘要抽取模型的训练装置,所述装置包括:
[0022]样本获取模块,用于获取样本问题、样本解答文本以及与所述样本问题对应的标注答案,所述样本解答文本包括至少一个候选答案;
[0023]相似度确定模块,用于确定所述至少一个候选答案与所述标注答案之间的相似度信息;
[0024]概率分布确定模块,用于基于所述相似度信息,确定所述样本解答文本中各文本单元对应的概率分布信息,所述概率分布信息用于表征所述各文本单元分别为答案摘要信息的起始位置和结束位置的概率;
[0025]模型训练模块,用于将所述概率分布信息作为标签信息进行机器学习训练,得到答案摘要抽取模型,以使所述答案摘要抽取模型基于输入问题确定与所述输入问题对应的答案摘要信息。
[0026]根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述答案摘要抽取模型的训练方法,或上述答案摘要抽取方法。
[0027]根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述答案摘要抽取模型的训练方法,或上述答案摘要抽取方法。
[0028]根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述答案摘要抽取模型的训练方法,或上述答案摘要抽取方
法。
[0029]本申请实施例提供的技术方案可以带来如下有益效果:
[0030]通过计算解答文本中各个候选答案与标注答案之间的相似度,进而确定解答文本中各文本单元是答案起始位置的概率分布,以及各文本单元是答案结束位置的概率分布,然后可将上述两种概率分布作为标签信息,即各个文本单元都对应具有上述两种概率作为该文本单元的软标签,极大地丰富了样本的标签信息,降低了模型对人工标注质量的依赖程度,避免标注失误或者标注噪音带来的影响。最后,基于上述各个文本单元的软标签对答案摘要抽取模型进行训练优化,能够使得模型能够更好地学习其他答案与标注答案之间的优劣关系,有效防止模型过拟合,提升了模型抽取答案摘要的准确性和灵活性,答案摘要抽取结果更加合理,确保快速准确地为用户提供所需的关键信息。
附图说明
[0031]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1是本申请一个实施例提供的应用程序运行环境的示意图;
[0033]图2是本申请一个实施例提供的答案摘要抽取模型的训练方法的流程图;
[0034]图3是本申请一个实施例提供的答案摘要抽取模型的训练方法的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种答案摘要抽取方法,其特征在于,所述方法包括:获取所述输入问题;基于所述输入问题,确定与所述输入问题对应的解答文本;将所述输入问题与所述解答文本输入至答案摘要抽取模型进行答案摘要抽取处理,得到与所述输入问题对应的答案摘要信息;其中,所述答案摘要抽取模型是以样本问题、样本解答文本以及所述样本解答文本中各文本单元对应的概率分布信息作为标签信息进行训练得到的机器学习模型,所述概率分布信息由所述样本解答文本中至少一个候选答案与所述样本问题对应的标注答案之间的相似度信息确定,且用于表征所述解答文本中文本单元分别为预测答案摘要信息的起始位置和结束位置的概率。2.根据权利要求1所述的方法,其特征在于,所述将所述输入问题与所述解答文本输入至答案摘要抽取模型进行答案摘要抽取处理,得到与所述输入问题对应的答案摘要信息,包括:基于所述输入问题与所述解答文本,生成拼接字符序列;确定所述拼接字符序列中各个字符的字符特征;基于所述字符特征,得到所述输入问题与所述解答文本中各文本单元的文本单元特征;根据所述文本单元特征,确定所述解答文本中各文本单元对应的第一输出概率和第二输出概率,所述第一输出概率为所述各文本单元为所述答案摘要信息的起始位置的概率,所述第二输出概率为预测所述各文本单元为所述答案摘要信息的结束位置的概率;基于所述各文本单元对应的第一输出概率和第二输出概率,确定所述答案摘要信息。3.一种答案摘要抽取模型的训练方法,其特征在于,所述方法包括:获取样本问题、样本解答文本以及与所述样本问题对应的标注答案,所述样本解答文本包括至少一个候选答案;确定所述至少一个候选答案与所述标注答案之间的相似度信息;基于所述相似度信息,确定所述样本解答文本中各文本单元对应的概率分布信息,所述概率分布信息用于表征所述各文本单元分别为答案摘要信息的起始位置和结束位置的概率;将所述概率分布信息作为标签信息进行机器学习训练,得到答案摘要抽取模型,以使所述答案摘要抽取模型基于输入问题确定与所述输入问题对应的答案摘要信息。4.根据权利要求3所述的方法,其特征在于,所述概率分布信息包括第一概率分布,所述第一概率分布用于表征所述各文本单元为所述起始位置的概率,所述基于所述相似度信息,确定所述样本解答文本中各文本单元对应的概率分布信息,包括:对于所述各文本单元中的目标文本单元,获取以所述目标文本单元为所述起始位置的各个候选答案与所述标注答案之间的第一语义相似度信息;基于所述第一语义相似度信息,确定所述目标文本单元的第一概率;基于所述各文本单元的第一概率,确定所述第一概率分布,所述第一概率分布包括所述各文本单元为所述起始位置的第一概率。5.根据权利要求4所述的方法,其特征在于,所述概率分布信息还包括第二概率分布,
所述第二概率分布用于表征所述各文本单元为所述结束位置的概率,所述基于所述相似度信息,确定所述样本解答文本中各文本单元对应的概率分布信息,包括:对于所述目标文本单元,获取以所述目标文本单元为所述结束位置的各个候选答案与所述标注答案之间的第二语义相似度信息;基于所述第二语义相似度信息,确定所述目标文本单元的第二概率;基于所述各文本单元的第二概率,确定所述第二概率分布,所...

【专利技术属性】
技术研发人员:王唯康
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1