模型训练以及内容生成方法和装置制造方法及图纸

技术编号:42630340 阅读:31 留言:0更新日期:2024-09-06 01:31
本公开提供了模型训练以及内容生成方法和装置,涉及大模型、深度学习、自然语言处理以及知识图谱等人工智能领域。其中的AIGC模型训练方法包括:构建第一训练集,其中包括第一训练样本,第一训练样本中包括:任一实体对应的第一训练图片以及第一训练图片的图片描述信息;利用第一训练集对第一内容生成模型的实体认知能力进行训练,得到第二内容生成模型;构建第二训练集,其中包括第二训练样本,第二训练样本中包括:目标提示词中的词语间的修饰关系信息,以及与目标提示词相匹配的第二训练图片;利用第二训练集,对第二内容生成模型的实体细节刻画能力进行训练,得到第三内容生成模型。应用本公开所述方案,可提升内容生成模型的指令遵循能力等。

【技术实现步骤摘要】

本公开涉及人工智能,特别涉及大模型、深度学习、自然语言处理以及知识图谱等领域的模型训练以及内容生成方法和装置


技术介绍

1、对于跨模态的人工智能内容生成(aigc,artificial intelligence generatedcontent)模型来说,需要提升其指令遵循(instruction following或prompt following)能力。跨模态即指文生图或文生视频等。指令遵循能力即指是否能够严格遵循给定的提示词(prompt)来进行内容生成的能力。


技术实现思路

1、本公开提供了模型训练以及内容生成方法和装置。

2、一种内容生成模型训练方法,包括:

3、构建第一训练集,所述第一训练集中包括第一训练样本,所述第一训练样本中包括:任一实体对应的第一训练图片以及所述第一训练图片的图片描述信息;

4、利用所述第一训练集对第一内容生成模型的实体认知能力进行训练,得到第二内容生成模型;

5、构建第二训练集,所述第二训练集中包括第二训练样本,所述第二训练本文档来自技高网...

【技术保护点】

1.一种内容生成模型训练方法,包括:

2.根据权利要求1所述的方法,其中,所述构建第一训练集包括:

3.根据权利要求2所述的方法,其中,所述构建实体认知图谱包括:

4.根据权利要求3所述的方法,其中,所述构建实体认知图谱还包括:

5.根据权利要求2所述的方法,其中,所述获取所述第一训练图片的图片描述信息包括:

6.根据权利要求5所述的方法,其中,所述利用所述第一训练图片对应的实体的实体名称和实体别名中的至少一项,对所述初始描述信息中的目标概念词进行替换包括以下任一项:

7.根据权利要求1~6中任一项所述的方法,其中,...

【技术特征摘要】

1.一种内容生成模型训练方法,包括:

2.根据权利要求1所述的方法,其中,所述构建第一训练集包括:

3.根据权利要求2所述的方法,其中,所述构建实体认知图谱包括:

4.根据权利要求3所述的方法,其中,所述构建实体认知图谱还包括:

5.根据权利要求2所述的方法,其中,所述获取所述第一训练图片的图片描述信息包括:

6.根据权利要求5所述的方法,其中,所述利用所述第一训练图片对应的实体的实体名称和实体别名中的至少一项,对所述初始描述信息中的目标概念词进行替换包括以下任一项:

7.根据权利要求1~6中任一项所述的方法,其中,所述构建第二训练集包括:

8.根据权利要求7所述的方法,其中,

9.根据权利要求7所述的方法,其中,所述根据所述部分历史提示词确定出所述目标提示词包括:

10.根据权利要求7所述的方法,其中,所述根据所述部分历史提示词确定出所述目标提示词包括:

11.根据权利要求7所述的方法,还包括:

12.根据权利要求7所述的方法,其中,分别获取各目标提示词的所述修饰关系信息包括:

13.根据权利要求12所述的方法,其中,

14.一种内容生成方法,包括:

15.根据权利要求14所述的方法,其中,所述获取所述待处理提示词中的词语间的修饰关系信息包括:

16.一种修饰关系判别模型训练方法,包括:

17.根据权利要求16所述的方法,其中,所述构建第三训练集包括:

18.根据权利要求17所述的方法,其中,所述从预定业务日志中记录的历史提示词集合中获取部分历史提示词包括:

19.根据权利要求17所述的方法,其中,所述根据获取到的各历史提示词,分别构建出对应的样本提示词包括:

20.根据权利要求19所述的方法,其中,所述根据填充结果确...

【专利技术属性】
技术研发人员:林泽南史亚冰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1