一种数据生成方法、装置、设备及介质制造方法及图纸

技术编号:41878048 阅读:24 留言:0更新日期:2024-07-02 00:31
本申请公开了一种数据生成方法、装置、设备及介质,该方法包括:将目标文本输入到多模态生成模型后,可以生成目标文本所对应的关联图片集合。然后基于关联图片集合确定初始图片集合。针对初始图片集合中的任一初始图片,将目标文本和初始图片输入到多模态表征感知模型,可以获取具有标注信息的初始图片。最后将初始图片集合所对应的具有标注信息的初始图片集合组成样本数据。通过本申请所提供的数据生成方法,可以基于各类文本生成多种类的图片,并且可以实现图片的自动标注,提高生成样本数据的效率以及样本数据的多样性。

【技术实现步骤摘要】

本申请涉及计算机,具体涉及一种数据生成方法、装置、设备及介质


技术介绍

1、深度学习是通过学习样本数据的内在规律和表示层次,使机器具有分析学习能力,能够识别文字、图像和声音等数据。深度学习依赖很强的样本数据信息,只有利用充分的样本数据进行训练学习,才能保证利用深度学习进行识别的准确性。

2、目前深度学习在很多任务上会遇到样本数据短缺的问题,通过人工标注的方式得到样本会花费大量的时间,并且生成的样本种类有限,导致深度学习十分受限于样本数据。


技术实现思路

1、有鉴于此,本申请提供一种数据生成方法、装置、设备及介质,以便提高生成样本数据的效率,提高样本数据的多样性。

2、为实现上述目的,本申请提供的技术方案如下:

3、在本申请第一方面,提供了一种数据生成方法,所述方法包括:

4、将目标文本输入到多模态生成模型,获取所述目标文本所对应的关联图片集合,所述多模态生成模型是利用第一文本集合以及与所述第一文本集合所对应的第一图片集合训练得到的;

5、基于所述关本文档来自技高网...

【技术保护点】

1.一种数据生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述多模态生成模型的训练过程包括:

3.根据权利要求2所述的方法,其特征在于,所述将目标文本输入到多模态生成模型,获取所述目标文本所对应的关联图片集合,包括:

4.根据权利要求1所述的方法,其特征在于,所述多模态表征感知模型的训练过程包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述目标文本和所述初始图片输入到多模态表征感知模型,获取具有标注信息的初始图片,包括:

6.根据权利要求4所述的方法,其特征在于,所述计算所述第二文本特...

【技术特征摘要】

1.一种数据生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述多模态生成模型的训练过程包括:

3.根据权利要求2所述的方法,其特征在于,所述将目标文本输入到多模态生成模型,获取所述目标文本所对应的关联图片集合,包括:

4.根据权利要求1所述的方法,其特征在于,所述多模态表征感知模型的训练过程包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述目标文本和所述初始图片输入到多模态表征感知模型,获取具有标注信息的初始图片,包括:

...

【专利技术属性】
技术研发人员:吴捷
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1