一种多跳问答模型训练方法及设备技术

技术编号:41522811 阅读:17 留言:0更新日期:2024-06-03 22:55
本申请实施例提供了一种多跳问答模型训练方法及设备,将问答样本数据及噪声标识输入到第一多跳问答模型中,在第一多跳问答模型根据噪声标识确定该问答样本数据为噪声数据时,获取该第一多跳问答模型输出的第一识别答案,根据第一识别答案及对应的标准答案确定第一损失值,根据第一损失值对第一多跳问答模型进行训练,同时将问答样本数据输入到第二多跳问答模型中,获取第二多跳问答模型输出的第二识别答案,根据第二识别答案及对应的标准答案确定第二损失值,根据第二损失值对第二多跳问答模型进行训练,经过第二设定数量次迭代后,采用第一多跳问答模型的参数,对第二多跳问答模型的参数进行调整,有效提高了多跳问答模型训练的效果。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种多跳问答模型训练方法及设备


技术介绍

1、现有的深度学习模型,要取得一个较好的效果,训练数据要求动辄10万级别,在这样的前提下,数据收集工作通常需要分工配合实施,以达到快速见效的目的。而基于知识图谱的多跳问答模型训练,不仅需要图谱数据,还需要问答数据,大规模图谱数据和问答数据的收集需要分工配合进行,在分工配合收集数据时,收集到的数据中难免会出现噪声数据,即图谱数据与问答数据不匹配的问题,例如,出现错别字或者实体关系错误等问题。

2、当进行训练的数据中存在噪声数据时,会对多跳问答模型训练的效果产生影响,并且收敛难度会增加。

3、因此,如何降低噪声数据对多跳问答模型训练的影响,以提高多跳问答模型的准确率成为亟待解决的问题。


技术实现思路

1、本申请实施提供一种多跳问答模型训练方法及设备,用以解决现有技术中噪声数据影响多跳问答模型训练效果的问题。

2、第一方面,本申请提供了一种多跳问答模型训练方法,所述方法包括:

3、针对问答样本数据本文档来自技高网...

【技术保护点】

1.一种多跳问答模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,若样本集中的问答样本数据的噪声标识是随机生成标注的,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述第一噪声估计轮次的确定过程包括:

4.根据权利要求1所述的方法,其特征在于,若样本集中的问答样本数据的噪声标识是随机生成标注的,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述根据每个问答样本数据的修正损失值,对每个问答样本数据的噪声标识进行调整包括:

6.根据权利要求4所述的方法,其特征在于,所述第...

【技术特征摘要】

1.一种多跳问答模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,若样本集中的问答样本数据的噪声标识是随机生成标注的,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述第一噪声估计轮次的确定过程包括:

4.根据权利要求1所述的方法,其特征在于,若样本集中的问答样本数据的噪声标识是随机生成标注的,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述根据每个问答样本数据的修正损失值,对每个问答样本数据的噪声标识进行调整包括:

6.根据权利要求4所述的方法,...

【专利技术属性】
技术研发人员:孟卫明王彦芳张烘玮高雪松
申请(专利权)人:海信集团控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1