一种大模型对抗样本的生成方法技术

技术编号：38770887 阅读：13 留言：0更新日期：2023-09-10 10:44

本发明专利技术公开了一种大模型对抗样本的生成方法，该大模型对抗样本的生成方法包括以下步骤：采用生成式大模型，将音频信息和文本信息编码为中间特征，解码还原为音频文件；引入循环损失计算，随机替换掉音频部分信息，达到音频各部分信息解耦；利用强化学习，采用马尔科夫决策过程，减少了人工标注的工作量。该大模型对抗样本的生成方法引入循环损失，对中间特征各部分信息解耦，提升模型性能且对各部分可控；通过训练生成式大模型，降低对数据质量的要求；通过强化学习系统，根据输入的文本信息自动的选择恰当的情感信息等，做到了在数据层面无需额外情感标注，且合成后的结果对于情感的选择、强烈程度更加自然平滑。强烈程度更加自然平滑。强烈程度更加自然平滑。

全部详细技术资料下载

【技术实现步骤摘要】
一种大模型对抗样本的生成方法

[0001]本专利技术涉及深度学习
，具体地，涉及一种大模型对抗样本的生成方法。

技术介绍

[0002]强化学习(Reinforcement Learning)是一种机器学习的分支，它关注的是智能体(agent)在环境中执行操作(动作)，以获得最大的累积奖励(reward)。在强化学习中，智能体不断与环境进行交互，根据其行动的结果获得反馈(奖励或惩罚)，并尝试在未来的操作中优化累积奖励的总和。与监督学习不同，强化学习中没有提供明确的标签或正确答案，而是需要智能体在学习的过程中通过试错来找到最优策略；循环损失(Cycle loss)是一种常用于图像生成和翻译等任务的损失函数，它的基本思想是将一段数据通过一个转换器进行转换，然后再将转换后的数据再次通过一个反转换器转换回来，要求这个反转换后的结果与原始数据尽可能地接近。循环一致性损失的目的是保证转换过程是可逆的，防止信息的丢失；具体来说，在图像翻译任务中，需要将一种语言的文本转换成另一种语言的图像。循环一致性损失的作用是，将翻译后的图像再次翻译回原始语言的文本，要求得到的文本尽可能地与原始文本相同。这样一来，我们就可以通过反复进行翻译和反翻译来优化模型，使得翻译后的图像更加准确地表达原始文本所包含的信息。生成式大模型(Generative Large
‑
scale Models)是指那些基于大规模数据集进行无监督学习，可以生成新的数据或样本的深度学习模型，通常其训练需要大量计算资源、时间和数据。它们具有强大的生成能力和...

【技术保护点】

【技术特征摘要】
1.一种大模型对抗样本的生成方法，其特征在于，包括以下步骤：S1.采用生成式大模型，将音频信息和文本信息编码为中间特征，解码还原为音频文件；S2.引入循环损失计算，随机替换掉音频部分信息，达到音频各部分信息解耦；S3.利用强化学习，采用马尔科夫决策过程，减少了人工标注的工作量。2.根据权利要求1所述的一种大模型对抗样本的生成方法，其特征在于，所述S1包括以下步骤：S11.将文本信息输入到文本编码器中，在文本编码器中编码为词嵌入向量；S12.将音频信息采取多个音频编码器进行分别提取，编码为隐空间编码；S13.采用生成式大模型的主体部分将音频信息和文本信息编码为中间特征；S14.用开源音频编解码模型的解码器将其解码还原为对抗样本音频。3.根据权利要求2所述的一种大模型对抗样本的生成方法，其特征在于，所述S11包括以下步骤：S111.采用DeepPhonemizer模型将文本信息转变为音素形式输入到文本编码器中；S112.在文本编码器里对照音素的查找表转换为音素id后，编码为词嵌入向量。4.根据权利要求2所述的一种大模型对抗样本的生成方法，其特征在于，所述S12包括以下步骤：S121.采用四个主要编码器，即韵律信息编码器、情感信息编码器、音色信息编码器、其余信息编码器分别提取音频信息的各个部分；S122.各部分编码器负责根据输入的音频将其编码为各部分特征的隐空间编码。5.根据权利要求2所述的一种大模型对抗样本的生成方法，其特征在于，所述S13中的生成式大模型的主体部分包括一层的自回归transformer block和七层非自回归的transformer block，在架构上，所述自回归transformer block和所述七层非自回归的transformer block依次串联。6.根据权利要求1所述的一种大模型对抗样本的生成方法，其特征在于，所述S2包括以下步骤：S21.当生成式大模型的音频输入被随机替换为与文本信息不对应的内容时，停止循环损失的计算；S22.当生成式大模型的音频输入被随机替换为与文本信息音频内容相关时，引入循环损失计算。7.根据权利要求6所述的一种大模型对抗...

【专利技术属性】
技术研发人员：温正棋，王小鹏，
申请(专利权)人：中科极限元杭州智能科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人