【技术实现步骤摘要】
所属的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。本公开的示例性实施方式中还提供一种用于上述方法的电子设备,该电子设备可以是上述影像设备或服务器。一般的,该电子设备至少包括处理器和存储器,存储器用于存储处理器的可执行指令,处理器配置为经由执行可执行指令来执行上述方法。下面以图11中的移动终端1100为例,对本公开实施例中的电子设备的构造进行示例性说明。本领域技术人员应当理解,除了特别用于移动目的的部件之外,图11中的构造也能够应用于固定类型的设备。在另一些实施方式中,移动终端1100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现。各部件间的接口连接关系只是示意性示出,并不构成对移动终端1100的结构限定。在另一些实施方式中,移动终端也可以采用与图11不同的接口连接方
...【技术保护点】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述构建模型训练框架,包括:
3.根据权利要求1所述的方法,其特征在于,所述将目标任务的指令内容数据输入至所述模型训练框架进行迭代训练,包括:
4.根据权利要求3所述的方法,其特征在于,所述利用所述辅助模型对所述指令内容数据进行编码,得到第一编码特征,包括:
5.根据权利要求4所述的方法,其特征在于,所述预训练的大模型包括编码器层;所述基于所述预训练的大模型获取当前时刻的预测词的隐层向量,并根据所述隐层向量和所述第一编码特征,确定注意力向
...【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述构建模型训练框架,包括:
3.根据权利要求1所述的方法,其特征在于,所述将目标任务的指令内容数据输入至所述模型训练框架进行迭代训练,包括:
4.根据权利要求3所述的方法,其特征在于,所述利用所述辅助模型对所述指令内容数据进行编码,得到第一编码特征,包括:
5.根据权利要求4所述的方法,其特征在于,所述预训练的大模型包括编码器层;所述基于所述预训练的大模型获取当前时刻的预测词的隐层向量,并根据所述隐层向量和所述第一编码特征,确定注意力向量,还包括:
6.根据权利要求3所述的方法...
【专利技术属性】
技术研发人员:李伟康,李浩然,吴友政,何晓冬,
申请(专利权)人:京东城市北京数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。