【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种多跳问答模型训练方法及设备。
技术介绍
1、现有的深度学习模型,要取得一个较好的效果,训练数据要求动辄10万级别,在这样的前提下,数据收集工作通常需要分工配合实施,以达到快速见效的目的。而基于知识图谱的多跳问答模型训练,不仅需要图谱数据,还需要问答数据,大规模图谱数据和问答数据的收集需要分工配合进行,在分工配合收集数据时,收集到的数据中难免会出现噪声数据,即图谱数据与问答数据不匹配的问题,例如,出现错别字或者实体关系错误等问题。
2、当进行训练的数据中存在噪声数据时,会对多跳问答模型训练的效果产生影响,并且收敛难度会增加。
3、因此,如何降低噪声数据对多跳问答模型训练的影响,以提高多跳问答模型的准确率成为亟待解决的问题。
技术实现思路
1、本申请实施提供一种多跳问答模型训练方法及设备,用以解决现有技术中噪声数据影响多跳问答模型训练效果的问题。
2、第一方面,本申请提供了一种多跳问答模型训练方法,所述方法包括:
...
【技术保护点】
1.一种多跳问答模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,若样本集中的问答样本数据的噪声标识是随机生成标注的,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述第一噪声估计轮次的确定过程包括:
4.根据权利要求1所述的方法,其特征在于,若样本集中的问答样本数据的噪声标识是随机生成标注的,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述根据每个问答样本数据的修正损失值,对每个问答样本数据的噪声标识进行调整包括:
6.根据权利要求4所述的方法
...【技术特征摘要】
1.一种多跳问答模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,若样本集中的问答样本数据的噪声标识是随机生成标注的,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述第一噪声估计轮次的确定过程包括:
4.根据权利要求1所述的方法,其特征在于,若样本集中的问答样本数据的噪声标识是随机生成标注的,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述根据每个问答样本数据的修正损失值,对每个问答样本数据的噪声标识进行调整包括:
6.根据权利要求4所述的方法,...
【专利技术属性】
技术研发人员:孟卫明,王彦芳,张烘玮,高雪松,
申请(专利权)人:海信集团控股股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。