【技术实现步骤摘要】
本说明书涉及计算机,尤其涉及一种模型训练、业务执行方法、装置、存储介质及设备。
技术介绍
1、随着人工智能技术的发展,大语言模型(generative pre-trained transformer,chatgpt)在各个领域中被广泛应用,通过将各种不同类型的下游业务转换为语言生成业务(例如:将根据用户数据进行风控的风控业务转换为根据用户数据生成用户是否属于风险用户的文本的语言生成业务,从而可以根据执行转换后的语言生成业务所生成的语言文本进行业务风控,以保护用户的个人隐私数据),并通过大语言模型统一执行,以降低下游业务的执行成本的方法,也受到越来越多的关注。
2、但是,由于在部分业务中所使用的数据通常为复杂的结构化数据,而大语言模型所能够处理的数据通常为文本数据,从而导致这部分业务通过大语言生成模型执行的结果的准确性较差。
3、因此,如何能够提升通过大语言模型进行业务执行的结果的准确性,则是一个亟待解决的问题。
技术实现思路
1、本说明书提供一种模型训练、业务执行方
...【技术保护点】
1.一种模型训练方法,包括:
2.如权利要求1所述的方法,训练所述第一特征提取模型,具体包括:
3.如权利要求1所述的方法,训练所述第一特征提取模型,具体包括:
4.如权利要求1所述的方法,预训练第二特征提取模型,具体包括:
5.如权利要求4所述的方法,所述第二特征提取模型中设有特征交互网络和特征提取网络;
6.如权利要求4所述的方法,所述第二特征提取模型中设有特征交互网络和特征提取网络;
7.如权利要求4所述的方法,根据所述样本交互特征表示和所述第二样本数据对应的描述文本,对所述第二特征提取模型
...【技术特征摘要】
1.一种模型训练方法,包括:
2.如权利要求1所述的方法,训练所述第一特征提取模型,具体包括:
3.如权利要求1所述的方法,训练所述第一特征提取模型,具体包括:
4.如权利要求1所述的方法,预训练第二特征提取模型,具体包括:
5.如权利要求4所述的方法,所述第二特征提取模型中设有特征交互网络和特征提取网络;
6.如权利要求4所述的方法,所述第二特征提取模型中设有特征交互网络和特征提取网络;
7.如权利要求4所述的方法,根据所述样本交互特征表示和所述第二样本数据对应的描述文本,对所述第二特征提取模型进行预训练,具体包括:...
【专利技术属性】
技术研发人员:刘芳卿,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。