【技术实现步骤摘要】
本申请涉及计算机,具体涉及一种数据生成方法、装置、设备及介质。
技术介绍
1、深度学习是通过学习样本数据的内在规律和表示层次,使机器具有分析学习能力,能够识别文字、图像和声音等数据。深度学习依赖很强的样本数据信息,只有利用充分的样本数据进行训练学习,才能保证利用深度学习进行识别的准确性。
2、目前深度学习在很多任务上会遇到样本数据短缺的问题,通过人工标注的方式得到样本会花费大量的时间,并且生成的样本种类有限,导致深度学习十分受限于样本数据。
技术实现思路
1、有鉴于此,本申请提供一种数据生成方法、装置、设备及介质,以便提高生成样本数据的效率,提高样本数据的多样性。
2、为实现上述目的,本申请提供的技术方案如下:
3、在本申请第一方面,提供了一种数据生成方法,所述方法包括:
4、将目标文本输入到多模态生成模型,获取所述目标文本所对应的关联图片集合,所述多模态生成模型是利用第一文本集合以及与所述第一文本集合所对应的第一图片集合训练得到的;
...【技术保护点】
1.一种数据生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述多模态生成模型的训练过程包括:
3.根据权利要求2所述的方法,其特征在于,所述将目标文本输入到多模态生成模型,获取所述目标文本所对应的关联图片集合,包括:
4.根据权利要求1所述的方法,其特征在于,所述多模态表征感知模型的训练过程包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述目标文本和所述初始图片输入到多模态表征感知模型,获取具有标注信息的初始图片,包括:
6.根据权利要求4所述的方法,其特征在于,所
...【技术特征摘要】
1.一种数据生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述多模态生成模型的训练过程包括:
3.根据权利要求2所述的方法,其特征在于,所述将目标文本输入到多模态生成模型,获取所述目标文本所对应的关联图片集合,包括:
4.根据权利要求1所述的方法,其特征在于,所述多模态表征感知模型的训练过程包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述目标文本和所述初始图片输入到多模态表征感知模型,获取具有标注信息的初始图片,包括:
...【专利技术属性】
技术研发人员:吴捷,
申请(专利权)人:北京字跳网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。