【技术实现步骤摘要】
结果预测模型的训练方法、装置、设备、存储介质及产品
[0001]本申请实施例涉及机器学习领域,特别涉及一种结果预测模型的训练方法、装置、设备、存储介质及产品。
技术介绍
[0002]随着人工智能技术的不断发展,结果预测是指将待预测内容输入提前训练好的结果预测模型中,输出得到待预测内容对应的预测结果,例如:针对疾病预测领域,将病历内容输入疾病预测模型,输出得到病历内容对应的预测疾病。因此,需要通过大量的样本数据对结果预测模型进行训练。
[0003]在相关技术中,以疾病预测模型为例,通过大量的样本文本数据对样本预测模型进行无监督训练,使训练完成的结果预测模型具备特征表示提取能力,样本文本数据可以为任意领域的文本数据。
[0004]然而,在相关技术中,虽然在训练阶段使用任意领域的文本数据对样本预测模型训练能够提高模型的泛化能力,但是任意领域的文本数据会存在不符合指定内容领域下的数据使用规范,导致最终训练得到的结果预测模型在针对指定内容领域下的输入内容进行预测时降低结果预测模型输出结果的准确度。
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种结果预测模型的训练方法,其特征在于,所述方法包括:获取多个样本语句对,所述样本语句对中包括条件语句和结果语句,所述结果语句是在所述条件语句对应的条件限定下得到的结果内容,所述多个样本语句对是属于第一内容领域下的语句对;提取第i个样本语句对中条件语句对应的第一特征表示,以及提取所述多个样本语句对中结果语句分别对应的第二特征表示,i为正整数;获取所述第一特征表示与第n个结果语句对应的第二特征表示之间的第一特征相似度,以及获取所述第一特征表示与其他结果语句对应的第二特征表示之间的第二特征相似度,所述第n个结果语句是在符合所述第i个样本语句对中所述条件语句对应的条件限定下得到的结果内容,所述其他结果语句是除所述第n个样本语句对中的结果语句以外的结果语句,n为正整数;基于所述第一特征相似度和所述第二特征相似度之间的差异对所述样本预测模型进行训练,得到所述结果预测模型,所述结果预测模型用于对所述第一内容领域下的条件输入内容进行预测,得到所述条件输入内容对应的预测结果。2.根据权利要求1所述的方法,其特征在于,所述获取多个样本语句对,包括:获取多个样本数据内容,所述多个样本数据内容是属于所述第一内容领域下不同数据获取来源的数据内容;对第k个样本数据内容进行数据结构规范化调整,得到所述第k个样本数据内容对应的数据调整结果,所述数据调整结果中包括所述第k个样本数据内容对应的条件语句和至少一个结果语句,k为正整数;基于所述第k个样本数据内容对应的数据调整结果得到所述第k个样本数据内容对应的至少一个样本语句对,所述样本语句对中包括所述条件语句和所述结果语句。3.根据权利要求2所述的方法,其特征在于,所述样本数据内容包括样本题目,所述样本题目中包括题干语句和多个答案选项;所述对第k个样本数据内容进行数据结构规范化调整,得到所述第k个样本数据内容对应的数据调整结果,包括:将第k个样本题目中的题干语句确定为所述第k个样本题目对应的条件语句;将所述第k个样本题目中的多个答案选项确定为所述第k个样本题目对应的多个结果语句。4.根据权利要求2所述的方法,其特征在于,所述样本数据内容包括样本三元组数据,所述样本三元组数据中包括第一实体数据、第二实体数据以及所述第一实体数据和所述第二实体数据之间的实体关联关系数据;所述对第k个样本数据内容进行数据结构规范化调整,得到所述第k个样本数据内容对应的数据调整结果,包括:对第k个样本三元组数据中的第一实体数据和所述实体关联关系数据按照指定数据结构进行语句改写,得到所述第k个样本三元组数据对应的条件语句;将所述第k个样本三元组数据中的第二实体数据作为所述第k个样本三元组数据对应的结果语句。5.根据权利要求2所述的方法,其特征在于,所述基于所述第k个样本数据内容对应的
数据调整结果得到所述第k个样本数据内容对应的至少一个样本语句对之后,还包括:将所述第i个样本语句对中所述条件语句和所述第n个结果语句确定为所述第i个样本语句对中条件语句对应的正样本对;将所述第i个样本语句对中所述条件语句和所述其他结果语句确定为所述第i个样本语句对中条件语句对应的负样本对;所述获取所述第一特征表示与第n个结果语句对应的第二特征表示之间的第一特征相似度,以及获取所述第一特征表示与其他结果语句对应的第二特征表示之间的第二特征相似度,包括:获取所述正样本对对应的第一特征相似度,以及获取所述负样本对对应的第二特征相似度。6.根据权利要求2所述的方法,其特征在于,所述多个样本数据内容中包括多个不同数据类型的数据内容;所述获取多个样本数据内容之后,还包括:按照预设语句组成规则对所述多个样本数据内容分别进行内容提取,得到所述多个样本数据内容分别对应的条件关键句,以及得到所述多个样本数据内容分别对应的答案...
【专利技术属性】
技术研发人员:趙雨恬,王慧敏,孙继超,吴贤,郑冶枫,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。