【技术实现步骤摘要】
本专利技术涉及人工智能领域,具体是一种基于生成对抗网络和多模态数据的智能数据增强方法、装置及介质。
技术介绍
1、机器学习和人工智能(ai)领域,数据的质量和数量直接影响模型的性能和泛化能力。高质量的训练数据可以帮助模型更准确地学习目标任务。然而,收集和标注大量高质量数据通常是费时费力的过程,尤其在一些数据稀缺或获取困难的领域,如医疗影像、自然语言处理和自动驾驶等。因此,数据增强技术作为一种有效的解决方案,旨在通过各种方法生成新的训练样本,来补充和丰富原始数据集。
2、传统的数据增强方法主要依赖于对现有数据进行各种变换,如旋转、翻转、裁剪、缩放和颜色变换等。这些方法虽然简单易用,但其生成的数据样本通常缺乏足够的多样性和复杂性,尤其在面对高维度和复杂数据时,效果有限。
3、近年来,生成对抗网络(gan)和多模态数据处理技术的兴起,为数据增强提供了新的方法和思路。gan是一种强大的生成模型,能够生成高质量的合成数据样本。而多模态数据处理技术则可以利用不同模态数据(如图像、文本和音频)之间的互补信息,生成更为丰富和多样
...【技术保护点】
1.一种基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:步骤S01)所述图像增强包括旋转、翻转、裁剪、颜色抖动。
3.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:使用预训练的词向量模型Word2Vec、GloVe或者BERT将分词后的文本转化为向量表示。
4.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:对于音频数据,使用梅尔频率倒谱系数方法提取音频特征
...【技术特征摘要】
1.一种基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:步骤s01)所述图像增强包括旋转、翻转、裁剪、颜色抖动。
3.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:使用预训练的词向量模型word2vec、glove或者bert将分词后的文本转化为向量表示。
4.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:对于音频数据,使用梅尔频率倒谱系数方法提取音频特征,将音频信号转化为特征向量。
5.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:使用联合表示学习法进行多模态特征融合,具体步骤为:
6.根据权利要求1所述的基于生成对抗网络和多模态数据的智能数据增强方法,其特征在于:使用注意力机制进行多模态特征融合,使用自注意力或多头注意力机制...
【专利技术属性】
技术研发人员:李圣伟,贾荫鹏,李彬,魏子重,李锐,
申请(专利权)人:山东浪潮科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。