一种基于生成对抗网络和多模态数据的智能数据增强方法、装置及介质制造方法及图纸

技术编号:42658176 阅读:30 留言:0更新日期:2024-09-10 12:17
本发明专利技术涉及人工智能领域,具体是一种基于生成对抗网络和多模态数据的智能数据增强方法、装置及介质。本发明专利技术先对多模态数据进行预处理,然后进行多模态特征融合,在构建生成对抗网络模型并训练,最后基于训练好的生成对抗网络进行数据增强。本发明专利技术利用生成对抗网络生成高质量的合成数据样本,并基于多模态数据利用不同模态数据之间的互补信息,生成更为丰富和多样化的数据样本,有效提升了训练数据集的质量和多样性,从而提高了机器学习模型的性能和泛化能力。这种方法不仅适用于单一模态数据,还可以在多模态数据的场景中广泛应用,具有广泛的应用前景和实际价值。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,具体是一种基于生成对抗网络和多模态数据的智能数据增强方法、装置及介质


技术介绍

1、机器学习和人工智能(ai)领域,数据的质量和数量直接影响模型的性能和泛化能力。高质量的训练数据可以帮助模型更准确地学习目标任务。然而,收集和标注大量高质量数据通常是费时费力的过程,尤其在一些数据稀缺或获取困难的领域,如医疗影像、自然语言处理和自动驾驶等。因此,数据增强技术作为一种有效的解决方案,旨在通过各种方法生成新的训练样本,来补充和丰富原始数据集。

2、传统的数据增强方法主要依赖于对现有数据进行各种变换,如旋转、翻转、裁剪、缩放和颜色变换等。这些方法虽然简单易用,但其生成的数据样本通常缺乏足够的多样性和复杂性,尤其在面对高维度和复杂数据时,效果有限。

3、近年来,生成对抗网络(gan)和多模态数据处理技术的兴起,为数据增强提供了新的方法和思路。gan是一种强大的生成模型,能够生成高质量的合成数据样本。而多模态数据处理技术则可以利用不同模态数据(如图像、文本和音频)之间的互补信息,生成更为丰富和多样化的数据样本。...

【技术保护点】

1.一种基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:步骤S01)所述图像增强包括旋转、翻转、裁剪、颜色抖动。

3.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:使用预训练的词向量模型Word2Vec、GloVe或者BERT将分词后的文本转化为向量表示。

4.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:对于音频数据,使用梅尔频率倒谱系数方法提取音频特征,将音频信号转化为特...

【技术特征摘要】

1.一种基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:步骤s01)所述图像增强包括旋转、翻转、裁剪、颜色抖动。

3.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:使用预训练的词向量模型word2vec、glove或者bert将分词后的文本转化为向量表示。

4.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:对于音频数据,使用梅尔频率倒谱系数方法提取音频特征,将音频信号转化为特征向量。

5.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:使用联合表示学习法进行多模态特征融合,具体步骤为:

6.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:使用注意力机制进行多模态特征融合,使用自注意力或多头注意力机制...

【专利技术属性】
技术研发人员:李圣伟贾荫鹏李彬魏子重李锐
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1