一种基于生成对抗网络和多模态数据的智能数据增强方法、装置及介质制造方法及图纸

技术编号：42658176 阅读：30 留言：0更新日期：2024-09-10 12:17

本发明专利技术涉及人工智能领域，具体是一种基于生成对抗网络和多模态数据的智能数据增强方法、装置及介质。本发明专利技术先对多模态数据进行预处理，然后进行多模态特征融合，在构建生成对抗网络模型并训练，最后基于训练好的生成对抗网络进行数据增强。本发明专利技术利用生成对抗网络生成高质量的合成数据样本，并基于多模态数据利用不同模态数据之间的互补信息，生成更为丰富和多样化的数据样本，有效提升了训练数据集的质量和多样性，从而提高了机器学习模型的性能和泛化能力。这种方法不仅适用于单一模态数据，还可以在多模态数据的场景中广泛应用，具有广泛的应用前景和实际价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能领域，具体是一种基于生成对抗网络和多模态数据的智能数据增强方法、装置及介质。

技术介绍

1、机器学习和人工智能（ai）领域，数据的质量和数量直接影响模型的性能和泛化能力。高质量的训练数据可以帮助模型更准确地学习目标任务。然而，收集和标注大量高质量数据通常是费时费力的过程，尤其在一些数据稀缺或获取困难的领域，如医疗影像、自然语言处理和自动驾驶等。因此，数据增强技术作为一种有效的解决方案，旨在通过各种方法生成新的训练样本，来补充和丰富原始数据集。

2、传统的数据增强方法主要依赖于对现有数据进行各种变换，如旋转、翻转、裁剪、缩放和颜色变换等。这些方法虽然简单易用，但其生成的数据样本通常缺乏足够的多样性和复杂性，尤其在面对高维度和复杂数据时，效果有限。

3、近年来，生成对抗网络（gan）和多模态数据处理技术的兴起，为数据增强提供了新的方法和思路。gan是一种强大的生成模型，能够生成高质量的合成数据样本。而多模态数据处理技术则可以利用不同模态数据（如图像、文本和音频）之间的互补信息，生成更为丰富和多样

【技术保护点】

1.一种基于生成对抗网络和多模态数据的智能数据增强方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法，其特征在于：步骤S01）所述图像增强包括旋转、翻转、裁剪、颜色抖动。

3.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法，其特征在于：使用预训练的词向量模型Word2Vec、GloVe或者BERT将分词后的文本转化为向量表示。

4.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法，其特征在于：对于音频数据，使用梅尔频率倒谱系数方法提取音频特征，将音频信号转化为特...

【技术特征摘要】

1.一种基于生成对抗网络和多模态数据的智能数据增强方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法，其特征在于：步骤s01）所述图像增强包括旋转、翻转、裁剪、颜色抖动。

3.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法，其特征在于：使用预训练的词向量模型word2vec、glove或者bert将分词后的文本转化为向量表示。

4.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法，其特征在于：对于音频数据，使用梅尔频率倒谱系数方法提取音频特征，将音频信号转化为特征向量。

5.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法，其特征在于：使用联合表示学习法进行多模态特征融合，具体步骤为：

6.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法，其特征在于：使用注意力机制进行多模态特征融合，使用自注意力或多头注意力机制...

【专利技术属性】
技术研发人员：李圣伟，贾荫鹏，李彬，魏子重，李锐，
申请(专利权)人：山东浪潮科学研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人