一种合规文生图训练集构建方法、装置、设备及存储介质制造方法及图纸

技术编号:44524881 阅读:20 留言:0更新日期:2025-03-07 13:16
本申请公开一种合规文生图训练集构建方法、装置、设备及存储介质,所述方法可以在获取开源训练数据集后,先根据合规性评价信息从开源训练数据集中提取合规语料数据,再基于合规语料数据中的合规图片反推提示词,以及将提示词输入目标文生图模型,以通过目标文生图模型生成扩充图像,再根据提示词、扩充图像以及合规语料数据构建合规文生图训练集。所述方法可以基于开源训练数据集构建适配指定业务场景的合规训练集,缩短数据集的构建周期。并且通过扩充图像,提升训练数据集的数据量,使得在应用构建的训练数据集后,文生图模型可以输出更准确的图像生成结果。

【技术实现步骤摘要】

本申请涉及人工智能,尤其是涉及到一种合规文生图训练集构建方法、装置、设备及存储介质


技术介绍

1、文生图模型(text-to-image models)是一种根据文本描述生成相应的图像的人工智能模型,如生成对抗网络(gans)、扩散模型(diffusion models)或自回归模型等,文生图模型可以基于深度学习技术来学习文本和图像之间的映射关系。通过构建训练集,并使用训练集对文生图模型执行训练,使文生图模型能够正确理解输入的文本描述,并输出符合文本描述的图像。

2、由于文生图模型基于单一语言语料进行训练,导致对于其他语言的支持能力受限。并且文生图模型的训练语料在构建时,主要考虑当地的价值观及法律限制,导致生成的结果偏向于当地要求,与其他地区的要求区别较大,因此直接使用训练好的文生图模型经常输出不合规的图像生成结果。

3、为了获得合规的图像生成结果,需要重新构建符合使用地区要求的训练语料,用于执行文生图模型训练。例如,在寿险、健康险、产险等业务场景中,为了维护客情、拓展新客而创建的宣传文案中使用的图像,多数为本地元素及风格,同时还本文档来自技高网...

【技术保护点】

1.一种合规文生图训练集构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,根据合规性评价信息从所述开源训练数据集中提取合规语料数据,包括:

3.根据权利要求1所述的方法,其特征在于,根据合规性评价信息从所述开源训练数据集中提取合规语料数据,包括:

4.根据权利要求1所述的方法,其特征在于,根据合规性评价信息从所述开源训练数据集中提取合规语料数据,包括:

5.根据权利要求1所述的方法,其特征在于,根据合规性评价信息从所述开源训练数据集中提取合规语料数据,包括:

6.根据权利要求1所述的方法,其特征在于...

【技术特征摘要】

1.一种合规文生图训练集构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,根据合规性评价信息从所述开源训练数据集中提取合规语料数据,包括:

3.根据权利要求1所述的方法,其特征在于,根据合规性评价信息从所述开源训练数据集中提取合规语料数据,包括:

4.根据权利要求1所述的方法,其特征在于,根据合规性评价信息从所述开源训练数据集中提取合规语料数据,包括:

5.根据权利要求1所述的方法,其特征在于,根据合规性评价信息从所述开源训练数据集中提取合规语料数据,包括:

6.根据权利要求1所述的方法,其特征在于,将...

【专利技术属性】
技术研发人员:郑喜民舒畅陈远旭
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1