【技术实现步骤摘要】
模型训练方法及装置、内容生成方法及装置
[0001]本说明书的一个或多个实施例涉及人工智能
,特别的涉及模型训练方法及装置
、
内容生成方法及装置
。
技术介绍
[0002]AIGC(Artificial Intelligence Generated Content
,又称生成式
AI)
为人工智能生成内容
。AIGC
技术可自动分析和理解文本
、
图片
、
音频和视频等多种类型的数据,并根据数据自动生成数学模型,从而实现自动化建模
。
[0003]以图像数据为例,现有
AIGC
技术可以生成符合
prompt(
即
AI
提示词
)
描述的内容,但是生成内容无法同时保证符合
prompt
描述的内容以及
prompt
要求的风格
。
技术实现思路
[0004]本说明书一个或多个实施例描述了 ...
【技术保护点】
【技术特征摘要】
1.
模型训练方法,包括:获取训练样本,所述训练样本包括原始输入信息
、
与原始输入信息对应的原始内容
、
与原始输入信息对应的风格标注输入信息;利用内容模型的内容提取模块,从原始输入信息中提取内容输入信息;将所述内容输入信息输入内容模型的内容基础模型,输出第一内容;基于所述第一内容和所述原始输入信息,对风格模型进行训练,训练过程如下:利用风格模型的风格提取模块,从原始输入信息中提取风格预测输入信息;将风格预测输入信息和第一内容输入风格模型的风格基础模型,输出第二预测内容;将所述风格预测输入信息和所述第二预测内容输入风格模型的风格校验模块,输出风格类型匹配分;利用第一损失函数对风格预测输入信息和风格标注输入信息进行预测判断,利用第二损失函数对第二预测内容和原始内容进行预测判断,利用第三损失函数最大化风格校验模块输出的风格类型匹配分,当上述损失函数均满足收敛条件时,所述风格模型训练完毕,否则,重复上述训练过程
。2.
根据权利要求1所述的方法,所述训练样本还包括与原始输入信息对应的内容标注输入信息;在利用内容模型得到第一内容进行风格模型训练前,方法还包括,基于原始输入信息,对内容模型进行训练,训练过程如下:利用内容模型的内容提取模块,从原始输入信息中提取内容预测输入信息;将所述内容预测输入信息输入内容模型的内容基础模型,输出第一预测内容;将所述内容预测输入信息和所述第一预测内容输入内容模型的内容匹配模块,输出内容匹配分;利用损失函数一对内容预测输入信息和内容标注输入信息进行预测判断,利用损失函数二对第一预测内容和原始内容进行预测判断,利用损失函数三最大化内容匹配模块输出的内容匹配分,当上述损失函数均满足收敛条件时,所述内容模型训练完毕,否则,重复上述训练过程
。3.
根据权利要求2所述的方法,在所述内容模型和所述风格模型训练过程中,还包括:对训练过程中的风格预测输入信息和
/
或内容预测输入信息进行随机替换,替换为原始输入信息
。4.
根据权利要求2所述的方法,在所述内容模型和所述风格模型单独训练完毕后,还包括:对内容模型和风格模型进行联合训练,训练过程中的风格预测输入信息和
/
或内容预测输入信息将被随机替换为原始输入信息;所述联合训练中的内容模型和风格模型的训练流程同其单独训练流程
。5.
根据权利要求1或2或3或4所述的方法,所述将所述风格预测输入信息和所述第二预测内容输入风格模型的风格校验模块,输出风格类型匹配分,包括
:
所述风格预测输入信息输入风格校验模块的风格输入信息分类子模型,输出风格分类信息;所述第二预测内容输入风格校验模块的风格内容分类子模型,输出内容分类信息;利用风格校验模块的匹配子模块,计算风格分类信息和内容分类信息之间的风格类型匹配分
。6.
根据权利要求2或3或4所述的方法,所述将所述内容预测输入信息和所述第一预测
内容输入内容模型的内容匹配模块,输出内容匹配分,包括:利用内容匹配模块的内容分割子模块,以内容对象为分割目标,将第一预测内容分割成若干第一预测子内容;利用内容匹配模块的匹配子模块,计算每个第一预测子内容与内容预测输入信息的内容子匹配分,之后将所有内容子匹配分求和并输出总的内容匹配分
。7.
内容生成方法,基于根据权利要求2或3或4所述方法训练得到的内容模型和风格模型实现;所述内容生成方法包括:将输入信息输入内容模型中的内容提取模块,输出内容输入信息;将输入信息输入内容模型中的内容基础模型,输出第一目标内容;将输入信息输入风格模型中的风格提取模块,输出风格...
【专利技术属性】
技术研发人员:曹佳炯,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。