System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,具体涉及语言能力gpt模型训练方法、装置、计算机设备及存储介质。
技术介绍
1、随着gpt技术的发展,在自然语言处理领域,gpt模型已经取得了显著的成果,但是目前的gpt模型正在对语言表达能力准确的度量理解方面还比较缺乏,进而导致gpt模型输出不准确的情况,因此亟待提出一种新的语言能力gpt模型训练方法,以提高了对gpt模型对语言的表达内容的理解能力。
技术实现思路
1、有鉴于此,本专利技术提供了一种语言能力gpt模型训练方法、装置、计算机设备及存储介质,以解决gpt模型对语言表达能力度量不准确的问题。
2、第一方面,本专利技术提供了一种语言能力gpt模型训练方法,方法包括:
3、确定预获取的样本数据进行能力指标;
4、将样本数据的能力指标分别输入至预设模型,得到样本数据的初始参数权重;
5、将初始参数权重输入至gpt模型,得到与初始参数权重对应的第一概率分布和第二概率分布;
6、根据第一概率分布和第二概率分布,确定gpt模型的奖励得分;
7、将奖励得分输入至强化学习模型,得到gpt模型的调整参数,根据调整参数调整gpt模型,直至gpt模型的损失函数满足预设条件,输出训练好的gpt模型。
8、有益效果,通过预获取的样本数据进行能力指标的确定,能够更好地指导gpt模型的训练,提高模型的准确性和泛化能力。将样本数据的能力指标分别输入至预设模型,得到样本数据的初始参数权重,可以将需要
9、在一种可选的实施方式中,预设模型包括至少一个,将样本数据的能力指标输入至预设模型,得到样本数据的初始参数权重,具体包括:
10、将样本数据的能力指标输入至第一预设模型,得到与第一预设模型对应的第一初始参数权重,第一预设模型为至少一个预设模型中的任一个,每一个预设模型对应的初始参数权重分别是不同维度度量样本数据语言属性的参数权重。
11、在一种可选的实施方式中,gpt模型的奖励得分通过以下公式计算得到,
12、r=adkln(pa||qa)+bdkl(n-1)(pn-1||qn-1)+…+·gdkl(p1||q1)
13、其中,n的个数为预设模型的数量,pa为对应第n个预设模型对应的第一概率分布,qa为对应第n个预设模型的第二概率分布;n为大于等于1的正整数,a-g为与n个预设模型分别对应的初始权重参数;
14、
15、其中,p(x)为对应预设模型的第一概率分布,q(x)为对应预设模型的第二概率分布。
16、在一种可选的实施方式中,gpt模型的损失函数通过以下公式计算得到:
17、l=-∑(p(x)log(g(x))+aln+bln-1+…+gl1)
18、其中,p(x)为gpt模型的标注概率,g(x)为gpt模型的预测概率,l_n为第n个预设模型对应的损失函数,n为预设模型的个数,n为大于等于1的正整数。
19、在一种可选的实施方式中,预设模型包括词汇丰富模型、语篇连贯模型以及句法结构模型。
20、第二方面,本专利技术提供了一种语言能力gpt模型训练装置,其特征在于,装置包括:
21、确定能力指标模块,用于确定预获取的样本数据进行能力指标;
22、预测权重模块,用于将样本数据的能力指标分别输入至预设模型,得到样本数据的初始参数权重;
23、预测输出概率模块,用于将初始参数权重输入至gpt模型,得到与初始参数权重对应的第一概率分布和第二概率分布;
24、确定奖励模块,用于根据第一概率分布和第二概率分布,确定gpt模型的奖励得分;
25、强化学习模块,用于将奖励得分输入至强化学习模型,得到gpt模型的调整参数,根据调整参数调整gpt模型,直至gpt模型的损失函数满足预设条件,输出训练好的gpt模型。
26、在一种可选的实施方式中,预设模型包括至少一个,预测权重模块,具体用于:
27、将样本数据的能力指标输入至第一预设模型,得到与第一预设模型对应的第一初始参数权重,第一预设模型为至少一个预设模型中的任一个,每一个预设模型对应的初始参数权重分别是不同维度度量样本数据语言属性的参数权重。
28、在一种可选的实施方式中,gpt模型的奖励得分通过以下公式计算得到,
29、r=adkln(pa||qa)+bdkl(n-1)(pn-1||qn-1)+…+·gdkl(p1||q1)
30、其中,n的个数为预设模型的数量,pa为对应第n个预设模型对应的第一概率分布,qa为对应第n个预设模型的第二概率分布;n为大于等于1的正整数,a-g为与n个预设模型分别对应的初始权重参数;
31、
32、其中,p(x)为对应预设模型的第一概率分布,q(x)为对应预设模型的第二概率分布。
33、第三方面,本专利技术提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的语言能力gpt模型训练方法。
34、第四方面,本专利技术提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的语言能力gpt模型训练方法。
本文档来自技高网...【技术保护点】
1.一种语言能力GPT模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述预设模型包括至少一个,所述将所述样本数据的能力指标输入至预设模型,得到所述样本数据的初始参数权重,具体包括:
3.根据权利要求2所述的方法,其特征在于,所述GPT模型的奖励得分通过以下公式计算得到,
4.根据权利要求3所述的方法,其特征在于,所述GPT模型的损失函数通过以下公式计算得到:
5.根据权利要求1所述的方法,其特征在于,所述预设模型包括词汇丰富模型、语篇连贯模型以及句法结构模型。
6.一种语言能力GPT模型训练装置,其特征在于,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述预设模型包括至少一个,所述预测权重模块,具体用于:
8.根据权利要求6所述的装置,其特征在于,所述GPT模型的奖励得分通过以下公式计算得到,
9.一种计算机设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计
...【技术特征摘要】
1.一种语言能力gpt模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述预设模型包括至少一个,所述将所述样本数据的能力指标输入至预设模型,得到所述样本数据的初始参数权重,具体包括:
3.根据权利要求2所述的方法,其特征在于,所述gpt模型的奖励得分通过以下公式计算得到,
4.根据权利要求3所述的方法,其特征在于,所述gpt模型的损失函数通过以下公式计算得到:
5.根据权利要求1所述的方法,其特征在于,所述预设模型包括词汇丰富模型、语篇连贯模型以及句...
【专利技术属性】
技术研发人员:陈丽,郑勤华,杜君磊,朱迁踏,王怀波,柴唤友,宋义深,
申请(专利权)人:北京师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。