一种模型训练、业务执行方法、装置、存储介质及设备制造方法及图纸

技术编号:40780922 阅读:27 留言:0更新日期:2024-03-25 20:25
本说明书公开一种模型训练、业务执行方法、装置、存储介质及设备,服务器可以通过两阶段训练,得到第二特征提取模型,从而可以通过第二特征提取模型对第一特征提取模型输出的结构化特征表示进行调整,以减小第一特征提取模型输出的结构化特征表示和文本生成模型所需的文本数据对应的文本特征表示之间的差异,从而可以提升通过文本生成模型进行业务执行的结果的准确性。

【技术实现步骤摘要】

本说明书涉及计算机,尤其涉及一种模型训练、业务执行方法、装置、存储介质及设备


技术介绍

1、随着人工智能技术的发展,大语言模型(generative pre-trained transformer,chatgpt)在各个领域中被广泛应用,通过将各种不同类型的下游业务转换为语言生成业务(例如:将根据用户数据进行风控的风控业务转换为根据用户数据生成用户是否属于风险用户的文本的语言生成业务,从而可以根据执行转换后的语言生成业务所生成的语言文本进行业务风控,以保护用户的个人隐私数据),并通过大语言模型统一执行,以降低下游业务的执行成本的方法,也受到越来越多的关注。

2、但是,由于在部分业务中所使用的数据通常为复杂的结构化数据,而大语言模型所能够处理的数据通常为文本数据,从而导致这部分业务通过大语言生成模型执行的结果的准确性较差。

3、因此,如何能够提升通过大语言模型进行业务执行的结果的准确性,则是一个亟待解决的问题。


技术实现思路

1、本说明书提供一种模型训练、业务执行方法、装置、存储介质及本文档来自技高网...

【技术保护点】

1.一种模型训练方法,包括:

2.如权利要求1所述的方法,训练所述第一特征提取模型,具体包括:

3.如权利要求1所述的方法,训练所述第一特征提取模型,具体包括:

4.如权利要求1所述的方法,预训练第二特征提取模型,具体包括:

5.如权利要求4所述的方法,所述第二特征提取模型中设有特征交互网络和特征提取网络;

6.如权利要求4所述的方法,所述第二特征提取模型中设有特征交互网络和特征提取网络;

7.如权利要求4所述的方法,根据所述样本交互特征表示和所述第二样本数据对应的描述文本,对所述第二特征提取模型进行预训练,具体包括...

【技术特征摘要】

1.一种模型训练方法,包括:

2.如权利要求1所述的方法,训练所述第一特征提取模型,具体包括:

3.如权利要求1所述的方法,训练所述第一特征提取模型,具体包括:

4.如权利要求1所述的方法,预训练第二特征提取模型,具体包括:

5.如权利要求4所述的方法,所述第二特征提取模型中设有特征交互网络和特征提取网络;

6.如权利要求4所述的方法,所述第二特征提取模型中设有特征交互网络和特征提取网络;

7.如权利要求4所述的方法,根据所述样本交互特征表示和所述第二样本数据对应的描述文本,对所述第二特征提取模型进行预训练,具体包括:...

【专利技术属性】
技术研发人员:刘芳卿
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1